Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Магний в рационе: 10 продуктов, которые стоит есть женщинам после 50 лет Магний в рационе: 10 продуктов, которые стоит есть женщинам после 50 лет

В каких продуктах магния больше всего

Популярная механика
Одомашнивание: новый цикл Одомашнивание: новый цикл

До конца нынешнего десятилетия произойдет очередная революция

Популярная механика
«Водородная эйфория» закончилась: почему этот источник энергии не спасет планету «Водородная эйфория» закончилась: почему этот источник энергии не спасет планету

Почему «водородная энергия» оказалась лишь иллюзией?

Forbes
Юность, любовь, девятый вал: каким получился фильм «Море волнуется раз» Юность, любовь, девятый вал: каким получился фильм «Море волнуется раз»

«Море волнуется раз». Тихая картина о любви, ставки на которую делали не все

РБК
4 японских принципа, которые спасут вас от тревоги 4 японских принципа, которые спасут вас от тревоги

Как думаете, что можно назвать лучшим лекарством от тревожности?

Psychologies
Окружение намного сильнее влияет на пользователей соцсетей, чем считалось раньше: новое исследование Окружение намного сильнее влияет на пользователей соцсетей, чем считалось раньше: новое исследование

Как люди в онлайновых социальных сетях влияют друг на друга

Популярная механика
Давай сделаем это тихо! Климова и другие звезды, которые долго скрывали развод Давай сделаем это тихо! Климова и другие звезды, которые долго скрывали развод

Звезды, которые не сразу решились рассказать о смене своего семейного статуса.

VOICE
Буря в пустыне Буря в пустыне

Тимоти Шаламе и Дени Вильнёв — о страхе, жаре и проваленных пробах

Cosmopolitan
История вопроса: рекрутская повинность История вопроса: рекрутская повинность

Когда появилась рекрутская повинность и выражение «забрить в солдаты»

Культура.РФ
Флюороз: инструкция по спасению «пятнистых» зубов Флюороз: инструкция по спасению «пятнистых» зубов

Что собой представляет флюороз и как предупредить это некрасивое заболевание?

Cosmopolitan
Пропавшую 23-летнюю россиянку обнаружили прикованной наручниками в гараже Пропавшую 23-летнюю россиянку обнаружили прикованной наручниками в гараже

Громкая история, которая завершилась драматической развязкой

Cosmopolitan
Молекулы предложили переводить в хиральную суперпозицию Молекулы предложили переводить в хиральную суперпозицию

Физики описали молекулы в квантовой суперпозиции

N+1
Сделала пластику и жалею: откровенные признания тех, кто решился на операцию Сделала пластику и жалею: откровенные признания тех, кто решился на операцию

Порой желаемая пластическая операция не приносит долгожданного результата

Cosmopolitan
Все танцы только о любви: мир и театр Пины Бауш Все танцы только о любви: мир и театр Пины Бауш

Почему имя немецкого хореографа Пины Бауш уже не раз перевернуло мир искусства

РБК
Революция роботов: как происходит роботизация Японии Революция роботов: как происходит роботизация Японии

Роботы-консьержи и роботы-водители, продавцы, уборщики и учителя

Вокруг света
С чемоданом по жизни: 7 увлекательных книг о путешествиях и путешественниках С чемоданом по жизни: 7 увлекательных книг о путешествиях и путешественниках

Книги про подлинные путешествия

Популярная механика
Квантовая теория против гравитации: неужели они в самом деле так отличаются? Квантовая теория против гравитации: неужели они в самом деле так отличаются?

Как примирить два противоречивых столпа современной физики?

Популярная механика
Найден способ сделать перовскитовые солнечные батареи еще эффективнее Найден способ сделать перовскитовые солнечные батареи еще эффективнее

Ученые Нового физтеха ИТМО нашли способ повысить эффективность солнечных батарей

Популярная механика
NILETTO NILETTO

NILETTO о музыке, интервью и усталости

ЖАРА Magazine
Весь мир - театр: маски, которые носят знаки зодиака Весь мир - театр: маски, которые носят знаки зодиака

Что скрыто под маской знаков зодиака

Cosmopolitan
Дочь Пушкина, вышедшая замуж за принца: крутые виражи судьбы Натальи Дубельт Дочь Пушкина, вышедшая замуж за принца: крутые виражи судьбы Натальи Дубельт

Судьба дочери Пушкина

Cosmopolitan
Черная вдова: пожилая женщина отравила мужа и трех любовников ради денег Черная вдова: пожилая женщина отравила мужа и трех любовников ради денег

Женщина, несмотря на преклонный возраст, много лет проворачивала брачные аферы

Cosmopolitan
Почему мы «живем» в социальных сетях: 6 причин Почему мы «живем» в социальных сетях: 6 причин

Чего нам не хватает в реальной жизни, что заставляет нас «зависать» в соцсетях?

Psychologies
Крупнейший застройщик Китая вот-вот обанкротится: чем это грозит мировой экономике Крупнейший застройщик Китая вот-вот обанкротится: чем это грозит мировой экономике

Как Китай может подтолкнуть мир к новом кризису, похожему на кризис 2008 года

Forbes
Психология похудения Психология похудения

Что на самом деле скрывается за нашим желанием сбросить пару кило

Лиза
Подтяжка манекенщицы: новый и простой тренд в пластике, который делает моложе Подтяжка манекенщицы: новый и простой тренд в пластике, который делает моложе

Высокие скулы и объемные губы Анджелины Джоли давно неактуальны!

Cosmopolitan
В окаменелом хряще динозавра возрастом 125 миллионов лет обнаружили клеточное ядро с хроматином В окаменелом хряще динозавра возрастом 125 миллионов лет обнаружили клеточное ядро с хроматином

Вторая находка хроматина в ископаемых остатках позвоночных

N+1
Васту и баста Васту и баста

Соблюдение канонов философии васту в дизайне интерьера — нешуточная головоломка

AD
Как абстрактная математика помогает конкретной физике Как абстрактная математика помогает конкретной физике

Абстрактные математические теории помогают физикам понять, как устроен наш мир

Популярная механика
Детки в сетке: как стать кибергероем для ребенка и защитить его от онлайн-угроз Детки в сетке: как стать кибергероем для ребенка и защитить его от онлайн-угроз

Как обеспечить ребенку безопасность в Интернете?

Популярная механика
Открыть в приложении