Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Календарь огородника: что посадить в начале лета, чтобы успеть собрать урожай осенью Календарь огородника: что посадить в начале лета, чтобы успеть собрать урожай осенью

К счастью, есть растения, которыми не поздно заниматься даже летом

Популярная механика
В Италии нашли самую большую коллекцию костяных орудий возрастом 400 тысяч лет В Италии нашли самую большую коллекцию костяных орудий возрастом 400 тысяч лет

Древние люди систематически обрабатывали останки слонов

N+1
Кибербезопасность в бизнесе — игнорировать нельзя использовать Кибербезопасность в бизнесе — игнорировать нельзя использовать

Как кибербезопасность вписывается в общую систему информационной безопасности

Inc.
Нам нужна школа, где нет места буллингу Нам нужна школа, где нет места буллингу

Травля – одна из самых серьезных проблем в школе

Домашний Очаг
«Розовый. История цвета» «Розовый. История цвета»

Как розовый цвет получали в Средневековье

N+1
«Озорная и веселая»: Кейт Миддлтон обрела близкую подругу в королевской семье «Озорная и веселая»: Кейт Миддлтон обрела близкую подругу в королевской семье

У Кейт Миддлтон сложились теплые отношения с графиней Уэссекской Софи

Cosmopolitan
«Круто ты попал»: все скандалы на «Фабрике звезд» «Круто ты попал»: все скандалы на «Фабрике звезд»

Скандалы, интриги, расследования и таланты – вот что такое «Фабрика звезд»

VOICE
Мечты сбываются Мечты сбываются

Интерьер с африканскими мотивами в московской квартире

AD
Айседора Дункан и Сергей Есенин: ссоры и побои вместо романтики Айседора Дункан и Сергей Есенин: ссоры и побои вместо романтики

Была ли красивой история любви поэта Сергея Есенина и танцовщицы Айседоры Дункан

Cosmopolitan
Откуда взялись знаменитые короткие мелодии и звуки из заставок Netflix, HBO, Windows, Apple и фильмов Откуда взялись знаменитые короткие мелодии и звуки из заставок Netflix, HBO, Windows, Apple и фильмов

История создания трехсекундного звука бывает интереснее создания песни

Maxim
Чем заняться на Байкале: 6 активностей, которые стоит попробовать на Славном море Чем заняться на Байкале: 6 активностей, которые стоит попробовать на Славном море

Байкал ждет тебя в гости

Playboy
Стать частью природы. Что такое экотуризм и как он развивается в России Стать частью природы. Что такое экотуризм и как он развивается в России

О видах экологического туризма, его развитии и местах, где им можно заняться

СНОБ
Город контактов Город контактов

Как Женева становилась домом для всех — от сентименталистов до революционеров

Weekend
Как в 50 лет выглядеть на 30: секреты Леры Кудрявцевой и других звездных бабушек Как в 50 лет выглядеть на 30: секреты Леры Кудрявцевой и других звездных бабушек

Глядя на фигуры звезд, сложно поверить, что они являются бабушками

VOICE
Что больнее: удар в пах для мужчин или рожать? Что больнее: удар в пах для мужчин или рожать?

Ученые ответили на самый неразрешимый межполовой вопрос!

Maxim
Анализ керамики позволил выяснить рацион питания древних жителей Латвии Анализ керамики позволил выяснить рацион питания древних жителей Латвии

Основными источниками пищи выступали пресноводная рыба, моллюски и свинина

N+1
Как взрыв сверхновой поможет точнее измерить скорость расширения Вселенной Как взрыв сверхновой поможет точнее измерить скорость расширения Вселенной

Как взрыв сверхновой поможет учёным лучше понять Вселенную

Популярная механика
Постоянная тонкой структуры выросла десятикратно в спиновом льду Постоянная тонкой структуры выросла десятикратно в спиновом льду

Физики смоделировали коллективные эффекты в спиновом льде

N+1
20 лет теракту 11 сентября. Вспоминаем этот день в 20 фотографиях 20 лет теракту 11 сентября. Вспоминаем этот день в 20 фотографиях

11 сентября 2001 года в Нью-Йорке был совершен крупнейший теракт в истории

Esquire
Юность, любовь, девятый вал: каким получился фильм «Море волнуется раз» Юность, любовь, девятый вал: каким получился фильм «Море волнуется раз»

«Море волнуется раз». Тихая картина о любви, ставки на которую делали не все

РБК
История стиля: 7 фильмов о великих кутюрье, которые изменили мир моды История стиля: 7 фильмов о великих кутюрье, которые изменили мир моды

От Шанель до Лагерфельда — истории восхождения звезд мира моды

Cosmopolitan
Правила жизни Александра Овечкина Правила жизни Александра Овечкина

Правила жизни русского хоккеиста Александра Овечкина

Esquire
Аннато, снежные грибы, бакучиол: почему они должны быть в твоей косметике Аннато, снежные грибы, бакучиол: почему они должны быть в твоей косметике

Трендовые компоненты, которые подарят твоей коже и волосам силу и красоту

Cosmopolitan
Пропил этил Пропил этил

История встречи, любви и расставания мужчины и стакана

Men’s Health
Жутко красиво: какими были бьюти-инструменты в эпоху наших бабушек и прабабушек Жутко красиво: какими были бьюти-инструменты в эпоху наших бабушек и прабабушек

На что шли наши предшественницы ради красоты в совсем недавнем прошлом?

Cosmopolitan
Как пользоваться хайлайтером для лица: пошаговая инструкция Как пользоваться хайлайтером для лица: пошаговая инструкция

Как правильно наносить хайлайтер на лицо?

VOICE
Ирина Апексимова. Живу как хочу Ирина Апексимова. Живу как хочу

Ирина Апексимова — о работе в театре и критике

Коллекция. Караван историй
Восстановить близость Восстановить близость

Как делить постель после измены партнера?

Psychologies
Семейный кинобизнес в эпоху корпораций: история Брокколи, которые 60 лет контролируют «бондиану» Семейный кинобизнес в эпоху корпораций: история Брокколи, которые 60 лет контролируют «бондиану»

Какую роль играет семья Брокколи в судьбе «бондианы»

VC.RU
Право голоса Право голоса

Почему кино взяло курс на дайверсити?

Vogue
Открыть в приложении