Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Мозг нужен не для мышления: 5 неожиданных фактов от профессора Гарварда Мозг нужен не для мышления: 5 неожиданных фактов от профессора Гарварда

Отрывок из книги ​«Семь с половиной уроков о мозге» ​

Популярная механика
Туже? Только бы не хуже! Туже? Только бы не хуже!

Можно ли «вытопить» жир c боков или сузить талию, затянув себя в чудо-пояс?

Здоровье
Ученые Tinkoff Research вывели робота на правильную и безопасную дорогу Ученые Tinkoff Research вывели робота на правильную и безопасную дорогу

Новый метод обучения поможет роботам исследовать неизвестный окружающий мир

TechInsider
От чего отказаться при повышенном сахаре в крови: 9 запрещенных продуктов, о которых должен знать каждый От чего отказаться при повышенном сахаре в крови: 9 запрещенных продуктов, о которых должен знать каждый

Даже если уровень сахара в норме, от этих продуктов лучше отказаться

Популярная механика
8 ошибок психологов, которые выдают непрофессионалов 8 ошибок психологов, которые выдают непрофессионалов

Как понять, что перед вами психолог-профессионал?

Psychologies
Почему классические радар-детекторы такие большие Почему классические радар-детекторы такие большие

Какие бывают антенны в радар-детекторах

CHIP
Эскалация конфликта: 6 способов ее избежать Эскалация конфликта: 6 способов ее избежать

Как сохранить здравомыслие в стрессовой ситуации?

Psychologies
Политически и идеологически разобщенные: какое место в мировой политике занимают страны Латинской Америки Политически и идеологически разобщенные: какое место в мировой политике занимают страны Латинской Америки

Найдут ли страны Латинской Америки свой голос?

Esquire
Не ждем, а готовимся: что делать, если вас уволили Не ждем, а готовимся: что делать, если вас уволили

Что делать, если вас незаконно уволили, и как компенсировать моральный вред

СНОБ
Андрей Тютюшев: «Желания кого-то обгонять нет, важнее эффективность» Андрей Тютюшев: «Желания кого-то обгонять нет, важнее эффективность»

Андрей Тютюшев — о развитии «Сибагро», возникающих сложностях и их преодолении

Агроинвестор
Физики разобрались с квазибрэгговской дифракцией атомного конденсата на оптических решетках Физики разобрались с квазибрэгговской дифракцией атомного конденсата на оптических решетках

Описали, как зависит характер квазибрэгговской дифракции атомного конденсата

N+1
8 странных и поразительных фактов о страусах 8 странных и поразительных фактов о страусах

Чего вы точно не знали о страусах

Популярная механика
Актриса Катерина Шпица: «Труд награждается везением» Актриса Катерина Шпица: «Труд награждается везением»

Катерина Шпица рассказала о съемках для TV1000 Русское Кино

Cosmopolitan
8 продуктов, которые стоит включить в рацион при «забитых» артериях 8 продуктов, которые стоит включить в рацион при «забитых» артериях

Их стоит есть почаще и для профилактики, и чтобы очистить пострадавшие сосуды

Популярная механика
Диагноз в интернете: чем опасно «гуглить» симптомы при плохом самочувствии Диагноз в интернете: чем опасно «гуглить» симптомы при плохом самочувствии

Gочему не стоит искать симптомы в интернете

Inc.
Страх разоблачения и плата за везение: что такое синдром самозванца Страх разоблачения и плата за везение: что такое синдром самозванца

Рассказываем о причинах, признаках и популярности синдрома самозванца

Forbes
Анте Томич: «Чудо в ущелье Поскоков». Хорватский роман о перипетиях сумасбродного семейства Анте Томич: «Чудо в ущелье Поскоков». Хорватский роман о перипетиях сумасбродного семейства

Отрывок из романа о том, как Крешимир покинул родные края в поисках невесты

СНОБ
«Поражение всегда сирота» «Поражение всегда сирота»

В 1906 году прошло сразу два судебных процесса над военным командованием

Дилетант
Mazda CX-9. Неочевидное благородство Mazda CX-9. Неочевидное благородство

Лучшие модели автомобилей для России разрабатывались, как ни странно, в США

4x4 Club
Семья этой китаянки была в шоке, когда нашла ее фотоальбом: история Люн Пин, которая долгие годы скрывала свое прошлое Семья этой китаянки была в шоке, когда нашла ее фотоальбом: история Люн Пин, которая долгие годы скрывала свое прошлое

Люн Пин — певица, которой пришлось бежать из своей страны

Популярная механика
Как мультики помогают говорить с детьми на сложные темы Как мультики помогают говорить с детьми на сложные темы

Как поддерживающая анимация помогает детям не бояться болезни

СНОБ
Змея и ракета: как Мадлен Олбрайт придумала язык брошей Змея и ракета: как Мадлен Олбрайт придумала язык брошей

Самые примечательные и скандальные броши Мадлен Олдбрайт

РБК
Что делать, если AirPods не подключаются к устройству: инструкция Что делать, если AirPods не подключаются к устройству: инструкция

Что делать, если не получается подключить беспроводные наушники от Apple

Популярная механика
Кроличьи сказки Кроличьи сказки

Кролик в бабочке готовится к 70-летию: история знаменитого логотипа

Playboy
Как эмигрировать и не пожалеть: 5 ошибок, которые легко совершить Как эмигрировать и не пожалеть: 5 ошибок, которые легко совершить

С какими подводными камнями можно столкнуться, начав новую жизнь в другой стране

Psychologies
Потеря ребенка, смерть любимой и новая любовь: личная жизнь Киану Ривза Потеря ребенка, смерть любимой и новая любовь: личная жизнь Киану Ривза

Какие трагедии пережил Киану Ривз, и как складывается его личная жизнь сейчас

VOICE
Opel Zafira Life 4х4. Не внедорожник, но всё-таки... Opel Zafira Life 4х4. Не внедорожник, но всё-таки...

Каждое появление микроавтобуса у российских дилеров становится знаковым событием

4x4 Club
В индонезийском питомнике родился детеныш вымирающего суматранского носорога В индонезийском питомнике родился детеныш вымирающего суматранского носорога

Без разведения в неволе суматранские носороги обречены на исчезновение

N+1
Был ли знаменитый танк «Тигр» действительно таким великим? Был ли знаменитый танк «Тигр» действительно таким великим?

Стоил ли танк «Тигр» затраченных на него ресурсов и денег?

Популярная механика
«Моя отрада»: как воспитывала сына Клара Гитлер «Моя отрада»: как воспитывала сына Клара Гитлер

Какой была мать Адольфа Гитлера и как она воспитывала сына?

Cosmopolitan
Открыть в приложении