Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Без зубрежки: 5 захватывающих книг о математике Без зубрежки: 5 захватывающих книг о математике

Книги, написанные математиками об их любимом предмете

Популярная механика
Никакой соломы: 5 шагов, чтобы реанимировать сухие волосы и вернуть им блеск Никакой соломы: 5 шагов, чтобы реанимировать сухие волосы и вернуть им блеск

Как в домашних условиях восстановить сухие волосы.

VOICE
Как работают апельсиновые танкеры: удивительные факты о кораблях-соковозах Как работают апельсиновые танкеры: удивительные факты о кораблях-соковозах

Корабли-соковозы: как они доставляют соки по всему миру?

ТехИнсайдер
Все переживем: как перестать тревожиться и успокоить себя сейчас Все переживем: как перестать тревожиться и успокоить себя сейчас

Как не потерять контроль над собой и своей жизнью

Esquire
3 фактора, снижающих либидо у женщин: что делать 3 фактора, снижающих либидо у женщин: что делать

Что влияет на женское либидо и получение удовольствия от секса?

Psychologies
Какая у вас роль в семье? Какая у вас роль в семье?

Цель этого теста — помочь вам узнать, каков ваш персонаж в семейной группе

Psychologies
Как работали таксисты в СССР Как работали таксисты в СССР

Как жили и работали таксисты в Советском Союзе?

Maxim
Пилюли по подписке: могут ли нейросети и приложения заменить врача? Пилюли по подписке: могут ли нейросети и приложения заменить врача?

Могут ли нейросети корректно подбирать витамины и БАДы?

Inc.
Актинобактерии Pseudonocardiaceae захватили древнюю китайскую гробницу Актинобактерии Pseudonocardiaceae захватили древнюю китайскую гробницу

Биологи провели исследование микробиома ханьской гробницы Дахутин

N+1
Что такое привязанность и какие типы привязанности бывают Что такое привязанность и какие типы привязанности бывают

Наши взаимоотношения с людьми могут быть интерпретированы через разные теории

Cosmopolitan
Как разговаривать с ребенком в трудных ситуациях: советы от медицинского психолога Как разговаривать с ребенком в трудных ситуациях: советы от медицинского психолога

Как поддержать ребенка, если в мире тревога и неопределенность?

Популярная механика
История одного здания: Московская удельная контора История одного здания: Московская удельная контора

Усадьба, которая вошла в историю как Московская удельная контора

Культура.РФ
Рак почки: 7 ранних признаков, которые вы можете не заметить Рак почки: 7 ранних признаков, которые вы можете не заметить

Ранние признаки злокачественной опухоли почки

Популярная механика
Александра Урсуляк: «С возрастом становлюсь все смешнее и смешнее» Александра Урсуляк: «С возрастом становлюсь все смешнее и смешнее»

Иногда надо выплывать из своего аквариума в открытое море

Караван историй
Ключи от города Ключи от города

Ключ от города лежит у каждого из нас в кармане. Часто ли мы открываем им дверь?

Seasons of life
Переменная облачность Переменная облачность

Иногда хочется превратиться в существо-лежащее-на-спине-и-разглядывающее-облака

Вокруг света
Метод «90 минут»: как быстро и безболезненно похудеть, изменив всего одну привычку Метод «90 минут»: как быстро и безболезненно похудеть, изменив всего одну привычку

В интернете обсуждают новый способ похудения. Называется он просто — «90 минут»

VOICE
Как жили женщины в Советском Союзе и почему там не было гендерного равенства Как жили женщины в Советском Союзе и почему там не было гендерного равенства

Один из самых устойчивых мифов о феминизме

Forbes
10 любовных романов, которые поднимут тебе настроение 10 любовных романов, которые поднимут тебе настроение

Классические и новые любовные романы, от которых невозможно оторваться

Cosmopolitan
Лягушачья морда и птичье лицо: 5 самых необычных средневековых шлемов Лягушачья морда и птичье лицо: 5 самых необычных средневековых шлемов

Самые странные и красивые шлемы эпохи Средневековья

Популярная механика
Кис-кис в каплях Кис-кис в каплях

Обычная вода может превратиться в перекись водорода

Наука и жизнь
Стихи на костях Стихи на костях

Непростая судьба дочери основателя японской коммунистической партии Сэна Катаямы

Дилетант
Найден ключ к решению проблемы ожирения? Найден ключ к решению проблемы ожирения?

В чем причина лишнего веса — в неправильном питании, генетике или влиянии среды?

Psychologies
Что мешает тебе стать богатой: объясняет Михаил Лабковский Что мешает тебе стать богатой: объясняет Михаил Лабковский

Симптомы "врожденной бедности"

VOICE
Лампочка, которая не гаснет уже больше века Лампочка, которая не гаснет уже больше века

В Ливерморе, штат Калифорния, есть лампочка, которая не гаснет

Популярная механика
Докричаться до небес: ученые уже давно и серьезно намерены поговорить с инопланетянами. Вот что и как они уже сказали Докричаться до небес: ученые уже давно и серьезно намерены поговорить с инопланетянами. Вот что и как они уже сказали

Как люди пытаются вступить в контакт с инопланетянами и что пытаются рассказать

Популярная механика
Внутренняя мизогиния: что это и как с ней бороться Внутренняя мизогиния: что это и как с ней бороться

Разбираемся с вопросами о внутренней мизогинии с психологом

Psychologies
Почему мужчины не просят о помощи и чем это оборачивается Почему мужчины не просят о помощи и чем это оборачивается

Мужчины предпочитают оставаться в одиночестве и делать вид, что проблем нет

Psychologies
Как компания из Небраски помогает ФБР прослушивать пользователей Facebook и Google Как компания из Небраски помогает ФБР прослушивать пользователей Facebook и Google

Компания PenLink играет существенную роль в американской машине слежки

Forbes
Как избавиться от ожирения: бариатрическая хирургия Как избавиться от ожирения: бариатрическая хирургия

Что такое бариатрическая хирургия и в чем её суть?

Популярная механика
Открыть в приложении