Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как узнать возраст кошки: простые способы Как узнать возраст кошки: простые способы

Есть несколько простых методов выяснить, сколько вашей кошке лет

Популярная механика
Мертвый и сексуальный: топ горячих киноактеров, которых уже нет с нами Мертвый и сексуальный: топ горячих киноактеров, которых уже нет с нами

Любуемся теми, кого давно уже нет в живых

Cosmopolitan
Исследователи создали роботизированную руку, управляемую силой мысли Исследователи создали роботизированную руку, управляемую силой мысли

Ученые позволили парализованному мужчине управлять роботизированной рукой

Inc.
5 скандальных премьер, которые позже стали классикой 5 скандальных премьер, которые позже стали классикой

О том, как переживали неудачи Гоголь, Чайковский, Глинка, Чехов и Стравинский

Культура.РФ
Открывая космос Открывая космос

Путеводитель женщины-астронавта по миру миссий, чудес и перемен в космосе

kiozk originals
Психосоматика: как наши эмоции провоцируют заболевания Психосоматика: как наши эмоции провоцируют заболевания

Если есть заболевание, значит, есть и эмоция, которая «помогает» ему развиваться

Psychologies
15 горьких истин, которые так сложно признать 15 горьких истин, которые так сложно признать

Честные и горькие истины, которые необходимо проговорить

Psychologies
Память на лица. Тест-драйв нового Subaru Outback Память на лица. Тест-драйв нового Subaru Outback

Что японский кроссовер прячет под обманчиво консервативной внешностью?

РБК
Накопить денег, рассчитать платёж по кредиту и возможный доход: полезные формулы для личных финансов Накопить денег, рассчитать платёж по кредиту и возможный доход: полезные формулы для личных финансов

Формулы для личных финансов: теория, примеры и шаблон для работы

VC.RU
Орёл и решка в Риме Орёл и решка в Риме

Коллекционные монеты стабильно растут в цене, вызывая интерес даже у ювелиров

Robb Report
Помадный татуаж: вид перманента, который держится на губах максимально долго Помадный татуаж: вид перманента, который держится на губах максимально долго

Татуаж в помадной технике – абсолютная имитация «живого» мейкапа

Cosmopolitan
«Не хочу отдавать падчерице свободную комнату в своем доме» «Не хочу отдавать падчерице свободную комнату в своем доме»

После развода родителей дети часто становятся причиной споров и конфликтов

Psychologies
Урожай на автопилоте: зачем агрохолдингу Евтушенкова искусственный интеллект Урожай на автопилоте: зачем агрохолдингу Евтушенкова искусственный интеллект

Зачем крестьянину искусственный интеллект?

Forbes
Бытовая магия: как справиться с бессонницей Бытовая магия: как справиться с бессонницей

Ритуал для входа в изумрудный сон

Cosmopolitan
Сцены из супружеской жизни Сцены из супружеской жизни

Как быть, если ребенок присутствует при ссоре?

Лиза
Их поменяли полами Их поменяли полами

Татьяна Алешичева о ремейке «Сцен из супружеской жизни»

Weekend
Самцов кальмаров заподозрили в заботе о потомстве Самцов кальмаров заподозрили в заботе о потомстве

Самцы кальмаров заинтересовались условиями, в которых будет расти их потомство

N+1
Эффект зловещей долины: как распознать дипфейк и не дать себя обмануть Эффект зловещей долины: как распознать дипфейк и не дать себя обмануть

Как не стать жертвой дипфейков и что делать, если вас уже обманули

Forbes
В Сибири вывели новый сорт картофеля В Сибири вывели новый сорт картофеля

Ученые вывели новые перспективный сорт картофеля с большим содержанием крахмала

Популярная механика
Психосоматика и жир: о чем говорят «лишние» килограммы в области живота Психосоматика и жир: о чем говорят «лишние» килограммы в области живота

Как можно полюбить свое «несовершенство»?

Psychologies
Почему мы выгораем? Руководство по тому, как справиться со стрессом и работой одновременно Почему мы выгораем? Руководство по тому, как справиться со стрессом и работой одновременно

Как преодолеть первые симптомы выгорания и снова полюбить свою работу

Inc.
Революция роботов: как происходит роботизация Японии Революция роботов: как происходит роботизация Японии

Роботы-консьержи и роботы-водители, продавцы, уборщики и учителя

Вокруг света
А вдруг уволят?.. А вдруг уволят?..

Страх потерять работу может быть cтимулом или помехой в карьере

Лиза
Замок из песка. В Венеции показали «Дюну» Дени Вильнева Замок из песка. В Венеции показали «Дюну» Дени Вильнева

Фантастический фильм Дени Вильнева оказался жертвой завышенных ожиданий

РБК
Московская киновселенная: фильмы только о столице Московская киновселенная: фильмы только о столице

Фильмы, снятые в Москве и вдохновленные ею

GQ
«Увидимся в суде». Как ведутся дела о врачебной халатности и почему родственники умерших пациентов соглашаются на компенсации, не дожидаясь разбирательства «Увидимся в суде». Как ведутся дела о врачебной халатности и почему родственники умерших пациентов соглашаются на компенсации, не дожидаясь разбирательства

Отрывок из книги «Неидеальная медицина» о врачебных ошибках

СНОБ
Аглая Епанчина Аглая Епанчина

Психотерапевт размышляет о характере персонажа из романа «Идиот»

Psychologies
Грегор Макгрегор: аферист, который придумал собственную страну и стал мультимиллионером после продажи ее земель Грегор Макгрегор: аферист, который придумал собственную страну и стал мультимиллионером после продажи ее земель

Грегор Макгрегор убедил сотни людей в том, что он правитель райской страны

Популярная механика
Почему мы соглашаемся на посредственные отношения Почему мы соглашаемся на посредственные отношения

Пока мы не решим наших личных проблем, здоровые отношения нам не светят

Psychologies
Археологи нашли на Ямале останки людей с заведенными за таз руками и сжатыми кулаками Археологи нашли на Ямале останки людей с заведенными за таз руками и сжатыми кулаками

Ученые нашли останки двух людей с заведенными за таз руками и сжатыми кулаками

N+1
Открыть в приложении