Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Музыкальная эстетика заводов от саунд-дизайнеров: как записать чистый звук машины Музыкальная эстетика заводов от саунд-дизайнеров: как записать чистый звук машины

Кто такие саунд-дизайнеры и что такое сонорные объекты?

Популярная механика
Экзистенциальное отчаяние: к чему приводит отсутствие целей в жизни Экзистенциальное отчаяние: к чему приводит отсутствие целей в жизни

Что происходит с нашей психикой, если мы ни к чему не стремимся?

Psychologies
Революция в мире моды: как технологии меняют нашу одежду Революция в мире моды: как технологии меняют нашу одежду

Как уже сейчас в новинках мира моды проявляются тренды гардероба будущего

Inc.
Правда ли, что Юпитер — это Правда ли, что Юпитер — это

Был ли у Юпитера шанс стать полноценной звездой?

Популярная механика
Пять языков любви Пять языков любви

Секрет прочных отношений

kiozk originals
Что мы должны родителям Что мы должны родителям

Сколько мы должны отдать родителям за жизнь, заботу и воспитание?

Psychologies
Ученые изобрели тесто для пиццы без дрожжей, но все же пышное и легкое - шеф-повара его раскритиковали Ученые изобрели тесто для пиццы без дрожжей, но все же пышное и легкое - шеф-повара его раскритиковали

Ученый-материаловед приготовил бездрожжевое тесто для пиццы

Популярная механика
6 привычек, которые повышают уровень сахара в крови 6 привычек, которые повышают уровень сахара в крови

Какие наши ежедневные действия могут повысить уровень сахара в крови?

Популярная механика
5 продуктов, которые помогут сбросить вес 5 продуктов, которые помогут сбросить вес

Какие продукты помогут не набирать вес и даже сбросить его

Популярная механика
Авторские камео в фильмах: секретные роли в Авторские камео в фильмах: секретные роли в

Вы точно не догадывались, кто исполнял эти маленькие роли

Популярная механика
Мы живем в террариуме, а на Марсе есть жизнь: 6 теорий заговора о космосе, в которые все еще верят Мы живем в террариуме, а на Марсе есть жизнь: 6 теорий заговора о космосе, в которые все еще верят

Может и правда на Луне никто не высаживался

Playboy
История DVKB. Путь дизайнера и художника надгробий до собственного бренда керамики История DVKB. Путь дизайнера и художника надгробий до собственного бренда керамики

Дизайнер и художник по надгробиям придумали свой бренд керамики

Inc.
Как создать мобильное приложение: этапы разработки, через которые предстоит пройти Как создать мобильное приложение: этапы разработки, через которые предстоит пройти

Как строится работа над мобильными приложениями?

Популярная механика
Как починить компьютер, который стал перезапускаться? Избавляемся от проблемы самостоятельно Как починить компьютер, который стал перезапускаться? Избавляемся от проблемы самостоятельно

Почему компьютер сам перезапускается и что с этим делать

Популярная механика
По праву вождения По праву вождения

«Сядь за руль моей машины»: о пользе Чехова

Weekend
Как и когда нужно менять масло в автомате Как и когда нужно менять масло в автомате

Какое масло нужно лить в АКПП и когда его менять?

РБК
Что не так с хорошими ученицами? Что не так с хорошими ученицами?

Почему представление об успехе и хорошей самооценке отличниц — миф

Psychologies
5 рецептов блинов, которые всегда получаются 5 рецептов блинов, которые всегда получаются

Рецепты, по которым блин точно не будут комом

Cosmopolitan
Самые популярные книги в жанре фантастики за последние 5 лет Самые популярные книги в жанре фантастики за последние 5 лет

Истории о далёких планетах и давно прошедших временах

Популярная механика
Пролог к мировым войнам Пролог к мировым войнам

Русско-японская война стала шоком отнюдь не только для России

Дилетант
Вальгалла и тортики: 10 фактов о фильме Вальгалла и тортики: 10 фактов о фильме

Как из самого простого сюжета "Безумного Макса" получился эмоциональный боевик

Популярная механика
«45 заметок переговорщика»: как воздействовать на партнеров без эмоций и гнева «45 заметок переговорщика»: как воздействовать на партнеров без эмоций и гнева

Как повысить мастерство ведения переговоров?

Forbes
Suzuki AllGrip. Интеллигентный полный привод Suzuki AllGrip. Интеллигентный полный привод

Выбирая автомобиль, поинтересуйтесь какой у него тип привода

4x4 Club
Coca-Cola или Pepsi? 10 фактов о столетнем противостоянии брендов Coca-Cola или Pepsi? 10 фактов о столетнем противостоянии брендов

Ты что будешь — «Колу» или «Пепси»? Этот вопрос чуть ли не религиозный

ТехИнсайдер
Как формируются социальные связи подростков — отрывок из книги Лидии Денворт Как формируются социальные связи подростков — отрывок из книги Лидии Денворт

Биологические, психологические и эволюционные основы социальных связей

СНОБ
Как не дать обмануть себя при покупке квартиры. Советы риелторов Как не дать обмануть себя при покупке квартиры. Советы риелторов

Как приобрести квартиру и не попасться на уловки мошенников

СНОБ
Как советская девушка попала в гарем: удивительная история Клавдии Рыбиной Как советская девушка попала в гарем: удивительная история Клавдии Рыбиной

Брак с иностранцем для многих жительниц СССР был мечтой

Cosmopolitan
«Близкие контакты далеких предков: Как эволюционировал наш вид» «Близкие контакты далеких предков: Как эволюционировал наш вид»

Представьте, что ребенок лет пяти преследует в африканской саванне газелей

N+1
Cyber-Бетховен, или Почему у нейросетей (пока) не получаются хиты Cyber-Бетховен, или Почему у нейросетей (пока) не получаются хиты

Сможет ли в будущем нейросеть самостоятельно сочинять хиты

СНОБ
10 любовных романов, которые поднимут тебе настроение 10 любовных романов, которые поднимут тебе настроение

Классические и новые любовные романы, от которых невозможно оторваться

Cosmopolitan
Открыть в приложении