Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Режим многозадачности: как выполнять несколько задач одновременно и не сойти с ума Режим многозадачности: как выполнять несколько задач одновременно и не сойти с ума

Может ли человек быть многозадачным?

Популярная механика
45 трогательных цитат о маме, которые помогут тебе выразить свои чувства к ней 45 трогательных цитат о маме, которые помогут тебе выразить свои чувства к ней

Хочешь сказать маме несколько приятных слов? Тогда возьми на заметку эти цитаты

Cosmopolitan
В режиме «не беспокоить»: что такое синдром цифровой усталости, чем он опасен и как с ним бороться В режиме «не беспокоить»: что такое синдром цифровой усталости, чем он опасен и как с ним бороться

Как зумеры столкнулись с выгоранием от бесконечного скроллинга социальных сетей

Правила жизни
Звезда родилась Звезда родилась

Актриса Аня Тейлор-Джой в кино может быть кем угодно!

Grazia
Иммунитет от хамства: как реагировать на грубость Иммунитет от хамства: как реагировать на грубость

Как защититься от хамства, не опускаясь до него?

Psychologies
В индонезийском питомнике родился детеныш вымирающего суматранского носорога В индонезийском питомнике родился детеныш вымирающего суматранского носорога

Без разведения в неволе суматранские носороги обречены на исчезновение

N+1
Федор Федотов. Мой Федор Федотов. Мой

Федор Федотов — о победе в «Ледниковом периоде» и о «Серебряных коньках»

Коллекция. Караван историй
Химики получили ковалентные органические каркасы с рекордным размером пор Химики получили ковалентные органические каркасы с рекордным размером пор

Химики получили каркасы с большими порами, которые могут адсорбировать пепсин

N+1
Город с видом на Арарат: каким был задуман Ереван 100 лет назад Город с видом на Арарат: каким был задуман Ереван 100 лет назад

Книга «Ереван. Биография города» журналиста и писателя Марка Григоряна

Forbes
Первая Первая

Анна Фишер — знаменитая американская астронавтка, «первая мама в космосе»

Популярная механика
Что гравитационные волны рассказали нам о Вселенной Что гравитационные волны рассказали нам о Вселенной

Гравитационных волны помогли решить загадки эволюции галактик

Популярная механика
Болезнь Брюса Уиллиса: что такое афазия и как с ней живут Болезнь Брюса Уиллиса: что такое афазия и как с ней живут

Что такое афазия, как её лечат и как меняется жизнь при этом диагнозе

РБК
Брюс Уиллис завершил карьеру в кино: 13 его лучших фильмов Брюс Уиллис завершил карьеру в кино: 13 его лучших фильмов

Вспоминаем самые яркие фильмы с Брюсом Уиллисом

РБК
Другая женщина. Иногда появление соперницы – не трагедия, а выход Другая женщина. Иногда появление соперницы – не трагедия, а выход

Измена – ситуация банальная, но от этого она не становится менее болезненной

Лиза
Крокодилы: интересные факты и особенности Крокодилы: интересные факты и особенности

Крокодилы - крупные рептилии, обитающие в тропических регионах

Популярная механика
Как понять, кто ты, и наладить отношения с самим собой Как понять, кто ты, и наладить отношения с самим собой

Что делать, если вырос неуверенным человеком?

РБК
12 фильмов о беженцах и беженстве 12 фильмов о беженцах и беженстве

Фильмы о людях, живущих в переломные времена, людях, у которых больше нет места

Weekend
Камера, способная уловить ядерный взрыв: 580 000 000 000 кадров в секунду Камера, способная уловить ядерный взрыв: 580 000 000 000 кадров в секунду

Три знаменитые камеры для высокоскоростной съемки

ТехИнсайдер
Что вы не знали о божьих коровках: занимательные факты Что вы не знали о божьих коровках: занимательные факты

Божьи коровки — знакомые и любимые создания, но в них есть нечто большее

Популярная механика
Какие роботы сейчас популярны? Нейросети, распознавание эмоций, навигация и другие тренды робототехники Какие роботы сейчас популярны? Нейросети, распознавание эмоций, навигация и другие тренды робототехники

Разбираемся в главных вызовах робототехнической индустрии

Популярная механика
Как нам выдерживать неопределенность Как нам выдерживать неопределенность

Как жить, если теряешь уверенность в завтрашнем дне?

Psychologies
Как удалить все с компьютера без возможности восстановления Как удалить все с компьютера без возможности восстановления

Что делать, чтобы стереть информацию с компьютера полностью

CHIP
Рыбацкие сети, бумага и яблочная кожура: из чего делают ремешки для часов Рыбацкие сети, бумага и яблочная кожура: из чего делают ремешки для часов

На смену классической натуральной коже приходят нетрадиционные материалы

РБК
Ростбиф, сэр! Особенности британской кухни, которые тебя удивят Ростбиф, сэр! Особенности британской кухни, которые тебя удивят

Кто такой Полный Монти и что общего у сэндвичей и Гавайских островов?

Playboy
Внутренняя мизогиния: что это и как с ней бороться Внутренняя мизогиния: что это и как с ней бороться

Разбираемся с вопросами о внутренней мизогинии с психологом

Psychologies
5 способов избавиться от волос на лице: какой подойдет тебе? 5 способов избавиться от волос на лице: какой подойдет тебе?

Как избавиться от волос на лице

VOICE
Ни побеждённых, ни победителей Ни побеждённых, ни победителей

Сергей Витте оказался куда более умелым дипломатом, чем Комура Дзютаро

Дилетант
«Мужчины с трудом выносили мое управление»: хроники хозяйки книжного магазина в Каире «Мужчины с трудом выносили мое управление»: хроники хозяйки книжного магазина в Каире

Как открыть свой магазин в очень строгой стране? Отрывок из мемуаров Нади Вассеф

Forbes
Мы из будущего Мы из будущего

12-летняя балерина Александра Кожанова и 10-летний пианист Елисей Мысин

Harper's Bazaar
Анна Варпаховская. Ангел навынос Анна Варпаховская. Ангел навынос

Удивительно, но Анна Варпаховская за сорок лет не слишком изменилась

Коллекция. Караван историй
Открыть в приложении