Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как защититься от комаров: что нужно знать, отправляясь на природу Как защититься от комаров: что нужно знать, отправляясь на природу

Почему одних комары почти не кусают, а другие не знают, куда от них спрятаться?

Популярная механика
Как говорить с близкими о политике? Как говорить с близкими о политике?

Как выстраивать общение, чтобы не ругаться

Psychologies
Ожидание и реальность не совпадут: 8 вещей, которые не следует покупать в онлайн-магазинах Ожидание и реальность не совпадут: 8 вещей, которые не следует покупать в онлайн-магазинах

Рассказываем, какие позиции точно не стоит добавлять в корзину

ТехИнсайдер
Распространённое лекарство от артрита даёт надежду на лечение облысения Распространённое лекарство от артрита даёт надежду на лечение облысения

Препарат от артрита эффективно лечит очаговую алопецию

Популярная механика
Секрет приложения Finch: как уход за виртуальным питомцем помогает справиться с депрессией Секрет приложения Finch: как уход за виртуальным питомцем помогает справиться с депрессией

В России набирает популярность приложение Finch. Почему оно столь эффективно?

Psychologies
5 фактов о последнем из выживших пассажиров «Титаника» 5 фактов о последнем из выживших пассажиров «Титаника»

Несколько интересных фактов о последней выжившей с «Титаника».

Популярная механика
Как формируются социальные связи подростков — отрывок из книги Лидии Денворт Как формируются социальные связи подростков — отрывок из книги Лидии Денворт

Биологические, психологические и эволюционные основы социальных связей

СНОБ
На помощь! Как понять, верить ли благотворительной организации На помощь! Как понять, верить ли благотворительной организации

Как проверить благотворительную организацию на честность?

Cosmopolitan
«Я создаю блюда для людей»: как бывший маркетолог Владимир Чистяков стал ресторатором «Я создаю блюда для людей»: как бывший маркетолог Владимир Чистяков стал ресторатором

Ресторатор Владимир Чистяков — почему будущее индустрии за коллаборациями?

Forbes
25 человек, у которых явно не задался день 25 человек, у которых явно не задался день

Смейтесь над своими неудачами и не злитесь, когда это делают другие!

Популярная механика
Пикап становится кроссовером Пикап становится кроссовером

Самая быстрорастущая ниша рынка продолжает манить автопроизводителей

Эксперт
Не хлебом единым Не хлебом единым

Наш сегодняшний кулинарный герой – сэндвич: он подарил имя феномену поколения

Psychologies
Женщины-ученые, изменившие мир: невероятные открытия неслабого пола Женщины-ученые, изменившие мир: невероятные открытия неслабого пола

Яркие представительницы научного сообщества, внесшие вклад в развитие науки

Популярная механика
Грандиозные и уязвимые: что такое нарциссизм и нужно ли его бояться Грандиозные и уязвимые: что такое нарциссизм и нужно ли его бояться

Кто такие люди-нарциссы и всегда ли нужно рвать с ними отношения?

Forbes
На острие На острие

Актер Юрий Чурсин — о скрытом темпераменте и своих ролях

OK!
Как научиться жить без сахара Как научиться жить без сахара

Рассказываем, как жить в гармонии с собой, без всякой тяги к сладостям

Psychologies
Таинственный человек из Сомертона: загадочная смерть, которую не могут раскрыть вот уже 74 года Таинственный человек из Сомертона: загадочная смерть, которую не могут раскрыть вот уже 74 года

Попытки раскрыть "дело Тамам Шуд" продолжаются до сих пор

Популярная механика
Гори, ясно? Гори, ясно?

Как загореться тем, что действительно важно, и не погаснуть

Harper's Bazaar
Туберкулез в жизни и искусстве: обсуждение режиссера, художницы и врача Туберкулез в жизни и искусстве: обсуждение режиссера, художницы и врача

Как переплетены туберкулез в жизни и в искусстве

РБК
Ожирение печени: 9 продуктов, от которых стоит отказаться Ожирение печени: 9 продуктов, от которых стоит отказаться

Злоупотребление алкоголем — это не единственная причина ожирения печени

Популярная механика
Добавка оксида бария в катализатор увеличила эффективность получения этиленоксида Добавка оксида бария в катализатор увеличила эффективность получения этиленоксида

Химики разработали эффективный метод получения этиленоксида из углекислого газа

N+1
Физики научились адресно управлять слоями ультрахолодных молекул Физики научились адресно управлять слоями ультрахолодных молекул

Физики учатся исследовать новые фазы молекулярного вещества

N+1
Как испытывали знаменитую водородную бомбу Сахарова Как испытывали знаменитую водородную бомбу Сахарова

Первая советская водородная бомба РДС-6с – знаменитая «слойка Сахарова»

ТехИнсайдер
Польза свеклы для здоровья: 5 главных фактов Польза свеклы для здоровья: 5 главных фактов

В чем польза свеклы и когда её стоит есть с осторожностью?

РБК
5 признаков того, что ваша кошка скучает. Вот как с этим справиться 5 признаков того, что ваша кошка скучает. Вот как с этим справиться

Если кошка начинает скучать, это сказывается на ее хозяевах

Популярная механика
Счет идет на секунды Счет идет на секунды

Новые методы лечения инсульта и как его избежать, даже если ты в группе риска

Лиза
Как суперкомпьютеры помогают познавать окружающий мир: незаменимые машины современности Как суперкомпьютеры помогают познавать окружающий мир: незаменимые машины современности

Как эра цифровой трансформации помогает в изучении природных процессов

Популярная механика
Апофеоз странного: почему «Голова-ластик» Дэвида Линча — один из лучших дебютов в истории кино Апофеоз странного: почему «Голова-ластик» Дэвида Линча — один из лучших дебютов в истории кино

Чем пугает Дэвид Линч и почему он так любит свой первый фильм?

Esquire
5 рецептов блинов, которые всегда получаются 5 рецептов блинов, которые всегда получаются

Рецепты, по которым блин точно не будут комом

Cosmopolitan
Хочется, но колется: все, что ты хотела знать о ботоксе Хочется, но колется: все, что ты хотела знать о ботоксе

Делать уколы ботокса или нет? Но как не стать «куклой» и не потерять мимику?

VOICE
Открыть в приложении