Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

6 заболеваний кожи у собак, о которых должен знать каждый хозяин 6 заболеваний кожи у собак, о которых должен знать каждый хозяин

Какие проблемы с кожей встречаются у собак?

Популярная механика
Углеродно-азотное покрытие улучшило работу никелевого анода Углеродно-азотное покрытие улучшило работу никелевого анода

Ученые получили рекордно эффективный водородный топливный элемент

N+1
Как с телефона отправить геолокацию: способы для iPhone и Android Как с телефона отправить геолокацию: способы для iPhone и Android

Как передать геолокацию телефона друзьям, близким и коллегам

CHIP
Что влияет на желание в постели? Что влияет на желание в постели?

Какие факторы влияют на сексуальный темперамент

Psychologies
Бородавки от лягушек и плохое зрение от чтения в темноте: 7 мифов, в которые мы верили в детстве Бородавки от лягушек и плохое зрение от чтения в темноте: 7 мифов, в которые мы верили в детстве

Мифы, в которые многие из нас верили с детства

ТехИнсайдер
Остудить землю Остудить землю

Самые распространенные направления геоинженерии

Вокруг света
Постельные cцены Постельные cцены

Много полезных фактов о сне, которые мы собрали в честь Всемирного дня сна

Лиза
Как сложилась судьба советского солдата, который не хотел воевать: трагическая история знаменитой фотографии Как сложилась судьба советского солдата, который не хотел воевать: трагическая история знаменитой фотографии

Слышали ли вы о путешествиях этого снимка?

Популярная механика
Возможна ли дружба между мужчиной и женщиной? Возможна ли дружба между мужчиной и женщиной?

Какое место занимает сексуальность в отношениях друзей разного пола?

Psychologies
MUJEVA: «Была готова приплачивать сама, чтобы мои песни слушали» MUJEVA: «Была готова приплачивать сама, чтобы мои песни слушали»

MUJEVA — на что копит деньги и за что ее хейтят?

ЖАРА Magazine
Химики получили ковалентные органические каркасы с рекордным размером пор Химики получили ковалентные органические каркасы с рекордным размером пор

Химики получили каркасы с большими порами, которые могут адсорбировать пепсин

N+1
Жизнь без интернета: как проводили досуг наши бабушки и мамы Жизнь без интернета: как проводили досуг наши бабушки и мамы

А чем занимались девушки раньше, когда Сети не существовало?

Cosmopolitan
Пластика в 14, анорексия, отказ от мечты: как мать лепила звезд из сестер Хадид Пластика в 14, анорексия, отказ от мечты: как мать лепила звезд из сестер Хадид

Хотели ли сестры Хадид именно такой жизни?

Cosmopolitan
5 фактов о последнем из выживших пассажиров «Титаника» 5 фактов о последнем из выживших пассажиров «Титаника»

Несколько интересных фактов о последней выжившей с «Титаника».

Популярная механика
Концепция чёрного Концепция чёрного

Насыщенная палитра интерьера этого таунхауса поражает воображение

Идеи Вашего Дома
Сибирские Афины Сибирские Афины

Поднимаемся на Воскресенскую гору. С нее открывается замечательный вид на Томск

Отдых в России
36 лучших цитат об изменениях, которые помогут тебе двигаться вперед 36 лучших цитат об изменениях, которые помогут тебе двигаться вперед

Что бы ты ни делала, все твои труды будут вознаграждены, а цели - достигнуты

Cosmopolitan
Кто проживает на дне Марианской впадины: обитатели глубин Кто проживает на дне Марианской впадины: обитатели глубин

Рассказываем все, что известно о таинственных существах, обитающих на глубине

ТехИнсайдер
Звуковое сопровождение Звуковое сопровождение

Как бывший журналист создал в Германии приложение Endel для релаксации

Forbes
Palantir: как американские спецслужбы следят за населением Palantir: как американские спецслужбы следят за населением

Мы все под колпаком!

Популярная механика
5 проблем, которые можно решить, если посещать баню: рассказывает эксперт 5 проблем, которые можно решить, если посещать баню: рассказывает эксперт

Как сделать поход в парную максимально полезным для здоровья

Cosmopolitan
Вторичная выгода Вторичная выгода

Почему дети часто болеют, а муж после работы не торопится домой

Лиза
Как «прикурить» автомобиль и ничего не спалить Как «прикурить» автомобиль и ничего не спалить

Как оживить машину с помощью «прикуривания»?

РБК
Что происходит с яйцом в кипятке Что происходит с яйцом в кипятке

В кипятке белок становится твёрдым и белым — а что происходит с молекулами?

Наука и жизнь
Ошибка выжившего: как не стать жертвой выводов-заблуждений Ошибка выжившего: как не стать жертвой выводов-заблуждений

Что такое ошибка выжившего и как не стать жертвой самозаблуждений?

Forbes
Как понять свои ограничения и найти новые ресурсы Как понять свои ограничения и найти новые ресурсы

В реализации задуманного чаще всего мешают установки, заложенные в детстве

Psychologies
New Horizons подтвердил наличие гигантских криовулканов на Плутоне New Horizons подтвердил наличие гигантских криовулканов на Плутоне

Криовулканы на Плутоне не моли образоваться за счет эрозии

N+1
Самые большие ударные кратеры на Земле: следы древних метеоритов Самые большие ударные кратеры на Земле: следы древних метеоритов

Какие столкновения астероидов с Землей оставили самые большие кратеры?

Популярная механика
Туберкулез в жизни и искусстве: обсуждение режиссера, художницы и врача Туберкулез в жизни и искусстве: обсуждение режиссера, художницы и врача

Как переплетены туберкулез в жизни и в искусстве

РБК
«Ползут, чтоб вновь родиться в Вифлееме»: заглавное эссе из книги Джоан Дидион, звезды американской «Ползут, чтоб вновь родиться в Вифлееме»: заглавное эссе из книги Джоан Дидион, звезды американской

Книга «Ползут, чтоб вновь родиться в Вифлееме» Джоан Дидион

Esquire
Открыть в приложении