Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

3 отличных продукта для того, чтобы сбросить лишний вес 3 отличных продукта для того, чтобы сбросить лишний вес

Внимательно присмотритесь к тому, что именно кладете в тарелку каждый день

Популярная механика
Незнакомая знакомая Турция Незнакомая знакомая Турция

У самой границы с Сирией Турция предстает перед туристами совершенно неожиданной

Здоровье
Как языковые ИИ-модели добились такого невероятного прогресса всего за десятилетие Как языковые ИИ-модели добились такого невероятного прогресса всего за десятилетие

Что влияет на прогресс языковых ИИ-моделей?

ТехИнсайдер
Как стресс и волнения сказываются на состоянии кожи Как стресс и волнения сказываются на состоянии кожи

Раздражения, шелушения, краснота — почему количество жалоб на кожу возросло

Psychologies
Как увеличить член: 12 способов в домашних условиях и у специалиста Как увеличить член: 12 способов в домашних условиях и у специалиста

Как увеличить размер члена и действительно ли тебе это нужно?

Playboy
Интернет, нейросети и искусственная еда: что предсказали Стругацкие Интернет, нейросети и искусственная еда: что предсказали Стругацкие

Что предсказали фантасты братья Стругацкие

Культура.РФ
Бельмондо, сын Бельмондо. Кто воспитал великого французского актера Бельмондо, сын Бельмондо. Кто воспитал великого французского актера

Кто был кумиром для самого Жан-Поля Бельмондо

Esquire
Трагедия в Перми: 21 сентября объявлено днем траура Трагедия в Перми: 21 сентября объявлено днем траура

Кем, предположительно, оказался стрелок в Перми, и каким был его мотив?

Psychologies
Дома, которые строит Ким Дома, которые строит Ким

Почему французские боссы так доверяют британскому дизайнеру Киму Джонсу

Robb Report
Бешенство: как защитить себя от смертельно опасной болезни Бешенство: как защитить себя от смертельно опасной болезни

Самую важная информация о бешенстве

РБК
Витамины для мужчин: гид по продуктам Витамины для мужчин: гид по продуктам

Как выбрать необходимые витамины мужчинам

GQ
Ссоры с мамой, своя модная коллекция: малоизвестные факты о Надежде Михалковой Ссоры с мамой, своя модная коллекция: малоизвестные факты о Надежде Михалковой

10 интересных фактов о Надежде Михалковой

Cosmopolitan
В бой идет один сталинист В бой идет один сталинист

Как Всеволод Кочетов пытался спасти советскую культуру, но обнаружил пустоту

Weekend
Роберт Сапольски: «Когнитивная гибкость делает нас уязвимыми, но она же может нас защитить» Роберт Сапольски: «Когнитивная гибкость делает нас уязвимыми, но она же может нас защитить»

Почему многие стратегии управления стрессом не работают?

Reminder
Перл Соломоновна: как жена Молотова подарила женщинам СССР духи и пудру Перл Соломоновна: как жена Молотова подарила женщинам СССР духи и пудру

Неванильная жизнь женщины, благодаря которой появился аромат «Красная Москва»

Cosmopolitan
От Пиччоли до радости От Пиччоли до радости

Креативный директор Valentino Пьерпаоло Пиччоли — как важно быть несерьезным

Harper's Bazaar
7 мужских способов справиться с осенней хандрой 7 мужских способов справиться с осенней хандрой

Врачи советуют, как справиться с сезонной депрессией

Maxim
Замедляет электросамокаты, если водитель мешает пешеходам: сервис Link пытается изменить «дурную репутацию» кикшерингов Замедляет электросамокаты, если водитель мешает пешеходам: сервис Link пытается изменить «дурную репутацию» кикшерингов

Зачем компания Link внедрила в электросамокаты ИИ-систему

VC.RU
Актриса Лиза Янковская — о фамилии, мультивселенной и съемках «Пропавшей» Актриса Лиза Янковская — о фамилии, мультивселенной и съемках «Пропавшей»

Лиза Янковская не любит зум и самопробы, но обожает возможность не спешить

РБК
Избранные моменты из скандального интервью Дмитрия Гордона и Моргенштерна Избранные моменты из скандального интервью Дмитрия Гордона и Моргенштерна

Лучшие цитаты из удивительной беседы Гордона и Моргенштерна

Maxim
«Нелюбимы и одиноки»: что не так с мужчинами, мечтающими о дауншифтинге «Нелюбимы и одиноки»: что не так с мужчинами, мечтающими о дауншифтинге

Топ-менеджеры мечтают об экзотических профессиях, но опасаются реакции супруг

Cosmopolitan
Не верь, не делай: народные советы и рецепты из Сети, которые не работают Не верь, не делай: народные советы и рецепты из Сети, которые не работают

Правда о популярных "народных" рецептах в области косметологии

Cosmopolitan
От почтовых голубей до смарт-часов: как развивалась связь От почтовых голубей до смарт-часов: как развивалась связь

Как начиналась история связи?

Популярная механика
Войти в колею Войти в колею

Что такое послеотпускной синдром и как его преодолеть

Лиза

Как итальянской красотке удается выглядеть потрясающе на протяжении долгих лет

VOICE
Цикорий: польза, противопоказания, комментарий эксперта Цикорий: польза, противопоказания, комментарий эксперта

Цикорий может быть полезен для здоровья сердца, нормализации пищеварения и веса

РБК
Пни радио Пни радио

Стив Мартин и Мартин Шорт в «Убийствах в одном здании»

Weekend
Как скрыть шрамы, родинки и раны: остроумные тату реальных людей Как скрыть шрамы, родинки и раны: остроумные тату реальных людей

Тату, которые не просто скрыли несовершенства, а превратили их в изюминку

Cosmopolitan
Дружбе конец: почему так происходит и как сохранить отношения Дружбе конец: почему так происходит и как сохранить отношения

Что разрушает дружбу и что можно делать, чтобы ее сохранить

Psychologies
Неэффективный менеджер: пять черт характера, которые выдают плохого руководителя Неэффективный менеджер: пять черт характера, которые выдают плохого руководителя

Пять качеств, которые выдают плохого руководителя

Inc.
Открыть в приложении