Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как правильно чистить смартфон от загрязнений Как правильно чистить смартфон от загрязнений

Мобильный телефон называют одним из самых загрязнённых предметов в доме

Популярная механика
Химия была, но мы расстались: как фотограф Ольга Павлова помогает пережить онкологию Химия была, но мы расстались: как фотограф Ольга Павлова помогает пережить онкологию

Фотограф Ольга Павлова — о фототерапии и лиге онкофотографов

Forbes
Информационная безопасность: десять основных видов хакерских атак Информационная безопасность: десять основных видов хакерских атак

Отрывок из книги Антона Евгеньева «Ценность ваших решений»

Forbes
Отношения с мужем после родов: 5 фактов, о которых ты не знала Отношения с мужем после родов: 5 фактов, о которых ты не знала

Сеть переполнена советами для молодых матерей. Но стоит ли их слушать?

Cosmopolitan
50 вопросов, которые помогут построить более глубокие отношения 50 вопросов, которые помогут построить более глубокие отношения

О чем спросить человека, чтобы действительно узнать его лучше?

Psychologies
«Никогда не делайте все сами»: интервью с автором «Стоицизма 2.0» Массимо Пильюччи «Никогда не делайте все сами»: интервью с автором «Стоицизма 2.0» Массимо Пильюччи

Массимо Пильюччи — как быть более справедливым, смелым и добрым

Forbes
Учимся работать с цветом в образе: 11 ярких сочетаний, которые стоит попробовать Учимся работать с цветом в образе: 11 ярких сочетаний, которые стоит попробовать

Грамотно подобранные цвета могут кардинально изменить образ

Cosmopolitan
Теория запаха Теория запаха

Зачем в парфюмерных лабораториях изучают влияние ароматов на мозг

Glamour
Чего не стоит делать, если вам изменяют Чего не стоит делать, если вам изменяют

Вещи, которые точно не стоит делать, узнав об измене партнера

Psychologies
Я хочу стать веб-дизайнером — что делать Я хочу стать веб-дизайнером — что делать

Кто такой веб-дизайнер и как им стать?

Популярная механика
Ненадежные автомобили на вторичке. Антирейтинг экспертов Ненадежные автомобили на вторичке. Антирейтинг экспертов

Какие из актуальных моделей могут доставить проблемы, если купить их с пробегом

РБК
Очень тяжелые носители Очень тяжелые носители

Прототипы будущей сверхтяжелой ракеты Starship продолжают испытания

Популярная механика
Стоп-менеджер Стоп-менеджер

Почему тебя до сих пор не повышают? Есть пять вероятных причин

Cosmopolitan
5 причин разрешить детям плакать 5 причин разрешить детям плакать

Почему детям, вне зависимости от пола, нужно давать плакать

Psychologies
Классическая рама Классическая рама

Критерии выбора деревянных окон для квартиры

Идеи Вашего Дома
В организме больных Эболой нашли вирус пятилетней давности В организме больных Эболой нашли вирус пятилетней давности

Эболавирусы способны храниться в теле человека годами и вызывать новые вспышки

N+1
Крах BlackBerry и триумф Apple: как гибкость мышления помогает предпринимателям создавать великие компании Крах BlackBerry и триумф Apple: как гибкость мышления помогает предпринимателям создавать великие компании

Отрывок из книги Адама Гранта «Подумайте еще раз» — как научиться мыслить гибко

Inc.
Десятки миллионов продаж и минималистичный дизайн для родителей: почему переноска-«кенгуру» BabyBjörn стала популярной Десятки миллионов продаж и минималистичный дизайн для родителей: почему переноска-«кенгуру» BabyBjörn стала популярной

BabyBjörn осмыслила дизайн детских товаров так, чтобы они нравились родителям

VC.RU
12 честных причин никогда не встречаться с мужчиной, который намного старше тебя 12 честных причин никогда не встречаться с мужчиной, который намного старше тебя

Порой отношения с джентльменом в солидном возрасте — не очень хорошая история

VOICE
Залечили своих детей до смерти: самые ужасные случаи синдрома Мюнхгаузена Залечили своих детей до смерти: самые ужасные случаи синдрома Мюнхгаузена

Резонансные случаи делегированного синдрома Мюнхгаузена.

Cosmopolitan
«Дети похожи на Антуана»: Наталья Водянова впервые показала младших сыновей «Дети похожи на Антуана»: Наталья Водянова впервые показала младших сыновей

Топ-модель Наталья Водянова обнародовала редкие семейные кадры

Cosmopolitan
Планетологи нашли очень молодую вулканическую область на Венере Планетологи нашли очень молодую вулканическую область на Венере

Потоки лавы могли течь по Венере всего несколько тысяч лет назад

N+1
Елена Преснякова: Елена Преснякова:

Елена Преснякова: мы с Петровичем женаты гораздо больше сорока лет

Коллекция. Караван историй
Полярные ворота Полярные ворота

Как остановить отъезд людей из богатой Мурманской области

Forbes
Криптобудущее Криптобудущее

Жизненный цикл цивилизаций и наступающая эпоха свободы

Популярная механика
Как абстрактная математика помогает конкретной физике Как абстрактная математика помогает конкретной физике

Абстрактные математические теории помогают физикам понять, как устроен наш мир

Популярная механика
Добавление и вычитание одиночного фонона увидели при комнатной температуре Добавление и вычитание одиночного фонона увидели при комнатной температуре

Состояние ансамбля фононов может быть неклассическим

N+1
50 — это новые 30? 50 — это новые 30?

Еще недавно в 50 мы готовились к пенсии, а сегодня — в ожидании новой жизни

Psychologies
Инопланетяне в пустыне: каким получился десятый сезон Инопланетяне в пустыне: каким получился десятый сезон

Каким получился десятый сезон "Американской истории ужасов"

Esquire
Правильное молоко для вкусового сыра Правильное молоко для вкусового сыра

Компания «Русский сыр» запустила вторую молочную мегаферму в Калужской области

Эксперт
Открыть в приложении