Алгоритм, который синтезирует восстановленный звук

N+1Наука

Нейросеть озвучила беззвучную игру на фортепиано

Григорий Копиев

Американские разработчики создали алгоритм, который наблюдает за беззвучным видео игры на фортепиано и синтезирует восстановленный звук. Статья была представлена на конференции NeurIPS 2020.

Звук, производимый музыкальным инструментом во время исполнения мелодии, складывается из множества параметров: особенностей самого инструмента, исполняемой композиции, особенностей движений музыканта во время игры. Зная, как звучит конкретный музыкальный инструмент, человеку или алгоритму должно быть достаточно видеозаписи игры на нем, чтобы достаточно точно восстановить получающийся звук, но фактически разработчики компьютерных алгоритмов для этой задачи сталкиваются с трудностями.

Разработчики из Вашингтонского университета под руководством Эли Шлицермана (Eli Shlizerman) создали алгоритм для озвучивания игры на фортепиано, который учитывает не только сам факт нажатия клавиш, но и продолжительность. Алгоритм состоит из трех основных частей и они работают следующим образом. Сначала алгоритм Video2Roll получает на вход по пять последовательных кадров из видеозаписи, на которой сверху снята клавиатура и кисти рук музыканта. Этот алгоритм основан на сверточной нейросети ResNet18 и дополнен модулем внимания, позволяющими ему с большей вероятностью замечать нажатые клавиши, которые занимают лишь очень небольшую долю от всего кадра, и обучаемым корреляционным модулем, который позволяет

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Джеймс Уэбб» нашел нового кандидата в потенциально обитаемую планету-океан «Джеймс Уэбб» нашел нового кандидата в потенциально обитаемую планету-океан

Экзопланета LHS 1140b может быть потенциально обитаемой планетой

N+1
Белковая диета: принципы, меню, научные факты Белковая диета: принципы, меню, научные факты

Как работает белковая диета

РБК
«Джеймс Уэбб» подтвердил наличие экзопланеты в протопланетном диске путем ее необнаружения «Джеймс Уэбб» подтвердил наличие экзопланеты в протопланетном диске путем ее необнаружения

Телескоп понаблюдал за спиральным протопланетным диском у звезды MWC 758

N+1
Шведский роман-катастрофа, оставляющий надежду: фрагмент новой книги Микаеля Ниеми «Дамба» Шведский роман-катастрофа, оставляющий надежду: фрагмент новой книги Микаеля Ниеми «Дамба»

Роман Микаеля Ниеми «Дамба» погружает в атмосферу шведской глубинки

Esquire
Как защитить детей от сексуализированного насилия: инструкция для родителей Как защитить детей от сексуализированного насилия: инструкция для родителей

Почему важно говорить о сексуализированном насилии над детьми?

Psychologies
25 спортивных подвигов 25 спортивных подвигов

MAXIM вспоминает героические моменты спорта

Maxim
Насекомые — пища на все времена Насекомые — пища на все времена

Поедание насекомых стимулировало трудовую деятельность наших предков

Наука и жизнь
Диета молодости Диета молодости

Правильный рацион – ключевой элемент старения

Домашний Очаг
Если сотрудник вечно жалуется вам на жизнь: что можно сделать Если сотрудник вечно жалуется вам на жизнь: что можно сделать

Что делать, если ваш коллега решил «поплакаться в жилетку»

Psychologies
«Моего оптимизма хватит на двоих»: история мамы, чья дочь победила рак «Моего оптимизма хватит на двоих»: история мамы, чья дочь победила рак

История мамы и ее дочери, которые сумели победить рак благодаря оптимизму

Psychologies
Какие типы полного привода существуют и какой тебе подойдет больше всего Какие типы полного привода существуют и какой тебе подойдет больше всего

4x4 как дважды два

Maxim
13,5 вещей с аппетитными названиями, которые несъедобны и даже смертельны 13,5 вещей с аппетитными названиями, которые несъедобны и даже смертельны

Выплюнь это немедленно!

Maxim
Миллион лет во льдах: ученые выделили самую древнюю ДНК в истории науки Миллион лет во льдах: ученые выделили самую древнюю ДНК в истории науки

Извлечение и секвенирование самого старого образца ДНК, известного науке

Популярная механика
«Не хотим продавать бизнес»: братья из Вологды рассказали Тинькову о цели создать крупнейшую игровую компанию «Не хотим продавать бизнес»: братья из Вологды рассказали Тинькову о цели создать крупнейшую игровую компанию

Основатели Playrix решили сделать его самой дорогой игровой компанией в мире

Forbes
Астрономы впервые нашли гидрид хрома в атмосфере горячего юпитера Астрономы впервые нашли гидрид хрома в атмосфере горячего юпитера

Ученые изучили атмосферу горячего юпитера WASP-31b

N+1
Слегка размытый человек: что не так с документальным фильмом про Билли Айлиш Слегка размытый человек: что не так с документальным фильмом про Билли Айлиш

«Слегка размытый мир» — документальный фильм про Билли Айлиш

Forbes
5 книг, которые изменили нас и могут помочь вам 5 книг, которые изменили нас и могут помочь вам

Редакторы Reminder — о практической пользе чтения

Reminder
«Выбираю» «Выбираю»

Год, несмотря ни на что, был у Ингрид Олеринской вполне удачным

OK!
Лиам Нисон: «Такой фильм Клинт Иствуд мог бы снять в начале 80-х» Лиам Нисон: «Такой фильм Клинт Иствуд мог бы снять в начале 80-х»

Лиам Нисон нашел в себе пороху, чтобы пообщаться с нашей журналисткой братией

Maxim
«К черту вас с вашим Сталиным и его шайкой!» «К черту вас с вашим Сталиным и его шайкой!»

90 лет назад началась война советской власти против русской деревни

Наука
Фаина Павловна и ее «честная» сумочка Фаина Павловна и ее «честная» сумочка

История о детском саду, соседке и маленькой сумочке

Psychologies
Субмаринные воды Крыма Субмаринные воды Крыма

Дебет подземных вод Горного Крыма оценивается примерно в 330 млн м3 в год

Наука
Левый поворот ведет в никуда Левый поворот ведет в никуда

В России нет условий для левого поворота на политическом поле

Эксперт
Алексей Москалёв: «Выглядеть молодо можно, только замедлив процессы старения всего организма» Алексей Москалёв: «Выглядеть молодо можно, только замедлив процессы старения всего организма»

Как оставаться молодой, красивой и здоровой как можно дольше?

Здоровье
Пористый полимерный каркас позволил мышам эффективней нарастить мышечные клетки Пористый полимерный каркас позволил мышам эффективней нарастить мышечные клетки

Ученые предложили использовать пористый материал в тканевой инженерии

N+1
В Стэнфорде назвали 4 причины «усталости от Zoom» и способы ее предотвратить В Стэнфорде назвали 4 причины «усталости от Zoom» и способы ее предотвратить

4 основные причины, по которым видеоконференции утомляют людей

Inc.
Хлороиндазол восстановил зрительные пути мышей с рассеянным склерозом Хлороиндазол восстановил зрительные пути мышей с рассеянным склерозом

Хлороиндазол восстановил миелин отростков нейронов зрительного пути у мышей

N+1
Как сделать верный выбор? Находим ответ с помощью метафорических карт Как сделать верный выбор? Находим ответ с помощью метафорических карт

Как самостоятельно находить ответы на свои вопросы с помощью метафорических карт

Psychologies
Метод: “Сознание – всадник, бессознательное – лошадь” Метод: “Сознание – всадник, бессознательное – лошадь”

Метод, который заслужил неоднозначную славу

Psychologies
«Полезные идиоты» для Путина. Почему Amnesty International забанила Навального «Полезные идиоты» для Путина. Почему Amnesty International забанила Навального

Кремлевская кампания очернения «шовиниста Навального» идет в сетях давно

СНОБ
Открыть в приложении