Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

6 простых шагов, которые помогут быстро и правильно похудеть 6 простых шагов, которые помогут быстро и правильно похудеть

Как помочь себе похудеть?

Популярная механика
Мертвая хватка: 10 животных с мощнейшими укусами. Держитесь от них подальше Мертвая хватка: 10 животных с мощнейшими укусами. Держитесь от них подальше

Сегодня мы расскажем вам о 10-ти животных с самым сильным укусом

ТехИнсайдер
Зарядки, SIM-карты и кнопки: какие технологии в гаджетах могут исчезнуть уже через пару лет Зарядки, SIM-карты и кнопки: какие технологии в гаджетах могут исчезнуть уже через пару лет

О том, какие технологии в гаджетах имеют тенденцию к полному исчезновению

ТехИнсайдер
Однажды мы проснёмся в метавселенной Однажды мы проснёмся в метавселенной

Юрий Мартынов, совладелец BMWclub.ru, описал нам будущее метавселенных

4x4 Club
Скандинавская ходьба: глупый тренд или топовое упражнение для поддержания здоровья? Скандинавская ходьба: глупый тренд или топовое упражнение для поддержания здоровья?

Оказывают ли какой-то эффект палки в скандинавской ходьбе?

ТехИнсайдер
Великий пост: почему нужно хотя бы раз попробовать его держать? Великий пост: почему нужно хотя бы раз попробовать его держать?

Пост: питание, запреты и длительности соблюдения ограничений в рационе

Cosmopolitan
Сочиняй мечты Сочиняй мечты

Соня Карпунина — о памятном подарке из космоса и необычных именах детей

OK!
«Фирмы платят за офис, чтобы контролировать людей»: как выстроены процессы в компании со свободным графиком труда «Фирмы платят за офис, чтобы контролировать людей»: как выстроены процессы в компании со свободным графиком труда

Как без ущерба для участников поддерживать рабочие процессы 24 часа в сутки

VC.RU
Трудоголизм: полезный навык или признак зависимости? Трудоголизм: полезный навык или признак зависимости?

Как вовремя распознать признаки трудоголизма, не навредив себе и близким

Psychologies
Как подключить компьютер к телевизору Как подключить компьютер к телевизору

Как использовать домашний телевизор вместо монитора?

ТехИнсайдер
Хомяки: питание, привычки и другие интересные факты Хомяки: питание, привычки и другие интересные факты

Что мы знаем о хомяках?

Популярная механика
Краткая история советского спортивного стиля, часть первая (1920–1960-е) Краткая история советского спортивного стиля, часть первая (1920–1960-е)

У СССР со спортом и физкультурой всегда были особые отношения

Esquire
Исландия, Хадльгримскиркья Исландия, Хадльгримскиркья

Это не Мордор и не Ктулхоград. А уютная христианская обитель с видом на вулканы

Maxim
20 сугубо научных фактов, о которых вы не знали: тут про «Ноздредамус», пот у бегемотов, коллективный разум и прочее 20 сугубо научных фактов, о которых вы не знали: тут про «Ноздредамус», пот у бегемотов, коллективный разум и прочее

Новая подборка удивительных сведений о мире, в котором мы живем

Популярная механика
5 шагов, чтобы научиться любить 5 шагов, чтобы научиться любить

Почему мы не можем терпеливо относиться к взрослым, которых любим?

Psychologies
Всегда помнить про «Smize!» Всегда помнить про «Smize!»

Актриса Полина Ауг — о стиле, нужных вещах и работе в новых реалиях

OK!
Напиток саке: сколько градусов, как правильно пить и чем закусывать (видео) Напиток саке: сколько градусов, как правильно пить и чем закусывать (видео)

Как делали саке 2 тысячи лет назад, кто его тогда пил и как пить сейчас?

Playboy
Дело чести: как ответить на оскорбление Дело чести: как ответить на оскорбление

Почему мы так болезненно реагируем на оскорбления?

РБК
10 животных, чей кал полезнее, чем кажется 10 животных, чей кал полезнее, чем кажется

Всему есть свое место в природе. Неужели, утилизировать можно даже экскременты?

Популярная механика
Эти женщины притворялись мужчинами, чтобы получить признание. Удивительные истории прошлого, которые изменили мир Эти женщины притворялись мужчинами, чтобы получить признание. Удивительные истории прошлого, которые изменили мир

Перед вами истории пяти женщин, которые помогли изменить права женщин в мире

ТехИнсайдер
Почему дружескую беседу стоит прерывать раньше, чем мы привыкли: мнение ученых о вежливости Почему дружескую беседу стоит прерывать раньше, чем мы привыкли: мнение ученых о вежливости

Большинство участников дружеской беседы хотят, чтобы она закончилась поскорее

ТехИнсайдер
Что делать, если компьютер начал сильно шуметь? Как исправить проблему своими руками Что делать, если компьютер начал сильно шуметь? Как исправить проблему своими руками

Что проверить, если компьютер начал странно шуметь?

Популярная механика
Танец воды: 21 самый необычный фонтан мира Танец воды: 21 самый необычный фонтан мира

Современные мастера добавили красоте красок, воде — огня, а трубам — прочности

Вокруг света
Безграничье Безграничье

Любовь это или зависимость, но когда я люблю кого-то, то всегда знаю, где он

Seasons of life
Операция, которой люди боялись веками: 10 фактов о лоботомии Операция, которой люди боялись веками: 10 фактов о лоботомии

История помнит немало варварских практик в медицине. Лоботомия - самая пугающая

ТехИнсайдер
Как говорить с близкими о политике? Как говорить с близкими о политике?

Как выстраивать общение, чтобы не ругаться

Psychologies
Даже некоторые повара неправильно используют эти простые кухонные гаджеты. Для чего на самом деле нужны эти вещи? Даже некоторые повара неправильно используют эти простые кухонные гаджеты. Для чего на самом деле нужны эти вещи?

В вашем доме найдется немало гаджетов, которыми вы пользуетесь неправильно

ТехИнсайдер
В Сербии обнаружили останки древнейших балканских неандертальцев В Сербии обнаружили останки древнейших балканских неандертальцев

Археологи подтвердили существование неандертальцев на Балканах

N+1
Жить прошлым: почему фокус на получении прибыли может навредить бизнесу Жить прошлым: почему фокус на получении прибыли может навредить бизнесу

Отрывок из книги «Красная и желтая стратегии» о том, чем опасен фокус на прибыли

Forbes

У каждой пары есть свой маленький ритуал

Playboy
Открыть в приложении