Что собой представляет проект Ayana и какие возможности он открывает

ФедералПрессHi-Tech

Разработчик приложения Ayana: «Языки и культуру малых народов спасет искусственный интеллект»

Станислав Казаченко

Современная жизнь считается угрозой для культур коренных малочисленных народов Севера. Например, из 37 тысяч живущих в России эвенков лишь 5 тысяч на достаточном уровне владеют родным языком. Однако технический прогресс может быть и помощником в сохранении традиционного уклада. Примером тому может служить Ayana — голосовой помощник на эвенкийском языке, аналог известных «Алисы» и «Маруси». О том, что собой представляет проект и какие возможности он открывает, рассказал разработчик Николай Апросимов.

Роботы говорят по-эвенкийски

С чего началась работа над вашим проектом?

Впервые такая идея появилась в 2019 году, а непосредственная работа началась год спустя, когда мы выиграли грант министерства по развитию Арктики РС(Я). На тот момент речь шла только о создании переводчика с русского на эвенкийский язык. Мы искали способы реализации, перебирали варианты и в ходе работы стали погружаться в особенности функционирования искусственного интеллекта. И когда в процессе мы услышали, как машина впервые в истории сказала «мэнду» (что по-эвенкийски значит «привет»), мы были шокированы. Поняли, что произошло нечто невообразимое. И главное, мы осознали, что появилась прямая надежда на сохранение нашего языка.

А дальше оказалось, что речь может идти больше чем об обычном переводчике в мобильном приложении. Создается как будто искусственное ядро родного языка, где можно собрать массив данных, включающий не только слова, но и культурный код. Так же, как у «Алисы», можно попросить включить музыку или можно будет сделать голосовой запрос об эвенкийской кухне, национальной одежде, о знаменитых эвенках. Конечно, проект вызвал эффект разорвавшейся бомбы, но в то же время мы получили достаточно много замечаний.

Для реализации подобного проекта нужен целый набор компетенций — от знания эвенкийского языка до навыков программирования. Как вы их получили и как формировалась команда?

Начну с того, что по профессии я не программист и не лингвист, а эколог. И больше того, хоть и принадлежу к эвенкийскому народу и являюсь потомком известного рода Апросимовых, долгое время нашим языком на должном уровне не владел. Впрочем, именно это и дало мне понимание, как важно сохранение национальной культуры и что для этого могут быть полезны современные технологии.

Все началось с просмотров тематических роликов на YouTube и изучения Google-переводчика. Дальше пришлось очень много учиться. Тем более что на первоначальном этапе у нас и не было ресурсов набрать широкую команду с разнообразными компетенциями. В том числе приходилось много консультироваться на сайте профессионалов в области ИТ — Habr, также в блог-канале «Теплица социальных технологий»*. Данные о языке брали с сайта Еvengus, который ведут лингвисты. Конечно, не всегда получалось успешно, была и своя череда неудач, в какой-то момент стало казаться, что на таком редком языке, как эвенкийский, вообще невозможно запустить работу с применением NLU («естественного распознавания языка». — Прим. ред.). NLU было необходимо для запуска именно голосового решения с последующим голосовым ответом пользователю.

* Министерством юстиции РФ внесен в реестр иностранных агентов.

Помощь пришла неожиданно — из Великобритании. Я много общался в профильных сообществах, и один собеседник из этой страны просто отправил видеосообщение и рассказал, что есть такой код, такая разметка, где можно кастомизировать речь, отправил мне репозитории. Мы начали работу и впервые смогли не только озвучить, но и провести кастомизацию по изучению эвенкийского языка. Именно тогда случился тот яркий момент, когда машина впервые сказала слова на эвенкийском языке. Мы стали применять разметку искусственного интеллекта (AIML), на основе которой созданы популярные языковые ассистенты по всему миру.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Защита краснокнижных растений и животных: один из национальных приоритетов Защита краснокнижных растений и животных: один из национальных приоритетов

Как в России за последнее время усилились меры защиты животных

ФедералПресс
Тур де Кавказ Тур де Кавказ

На Geely Atlas Pro до Эльбруса и назад

Автопилот
По вертикальной траектории По вертикальной траектории

Об одной вещи, без которой жизнь горожанина превратится в кошмар

Наука и жизнь
Самодостаточность — не изоляция Самодостаточность — не изоляция

Успешно ли трансформируется IT-отрасль и будет ли достигнут цифровой суверенитет

FP. BusinessReview
Кино по правилам и без Кино по правилам и без

Фильмы, создатели которых не побоялись нарушить заданные стандарты

Правила жизни
Путь воды Путь воды

Как цифровизация помогает развивать российское ЖКХ

РБК
ЧВК «Рюрик» ЧВК «Рюрик»

Около 838 года в поле зрения Византии попали люди, называвших себя русами

Дилетант
Ананасы в шампанском. О чем и как писал Игорь Северянин Ананасы в шампанском. О чем и как писал Игорь Северянин

Как Игорю Северянину удалось стать «королем поэтов»?

СНОБ
Святой затворник Святой затворник

Этим летом исполнилось 660 лет со дня основания Борисоглебского монастыря

Отдых в России
Как связаны принцессы Диснея и самооценка детей: интересное исследование! Как связаны принцессы Диснея и самооценка детей: интересное исследование!

Как дети выбирают любимых принцесс и что это о них говорит?

ТехИнсайдер
Глава АНО «Цифровая экономика»: «Мы идем к новым прорывам» Глава АНО «Цифровая экономика»: «Мы идем к новым прорывам»

Сергей Плуготаренко рассказал о развитии ИТ-отрасли в РФ и ее перспективах

ФедералПресс
Совершенно запретно Совершенно запретно

Как Джон Хьюстон по заказу военных снял антивоенный фильм

Weekend
Как Ксения Сосункевич выращивает клубнику в Карелии, несмотря на климат и кризисы Как Ксения Сосункевич выращивает клубнику в Карелии, несмотря на климат и кризисы

Как живут и строят карьеру женщины в российских регионах

Forbes
Танец — это голос: как первые российские фильмы изображали эмансипированных женщин Танец — это голос: как первые российские фильмы изображали эмансипированных женщин

Глава из книги «Изображая женственность» — об артистках в раннем русском кино

Forbes
Роскошь для себя Роскошь для себя

Это не первое интервью с Александрой Ребенок. Но первое в таком формате

OK!
Хоррор дожития Хоррор дожития

Как Джордж А. Ромеро напугал стариками борцов с эйджизмом

Weekend
Без паники! Откуда берутся неврозы и как с ними справиться Без паники! Откуда берутся неврозы и как с ними справиться

Исследований невроза много, но ответы на главные вопросы не найдены до сих пор

Лиза
Субботы терпкий вкус Субботы терпкий вкус

Рисовать в Шаббат? Художница Елена Репетур убедилась, что Израиль — страна чудес

Seasons of life
Как понять, что мужчина женат Как понять, что мужчина женат

7 признаков, которые выдают изменщика

Лиза
Люди думали, что началась ядерная война: жуткая история крупнейшей железнодорожной катастрофы СССР Люди думали, что началась ядерная война: жуткая история крупнейшей железнодорожной катастрофы СССР

Железнодорожная катастрофа под Уфой: кошмар, случившийся наяву

ТехИнсайдер
Фёдор Сологуб Фёдор Сологуб

Русский поэт и писатель Фёдор Сологуб глазами Дмитрия Быкова

Дилетант
Музыкальная пауза: как Джонни Кэш записал величайший концертный альбом Музыкальная пауза: как Джонни Кэш записал величайший концертный альбом

Как концерт в Фолсомской тюрьме 1968 года перезапустил карьеру Джонни Кэша?

Правила жизни
«Власть дает художникам свободу поиска, пока не устоялся канон» «Власть дает художникам свободу поиска, пока не устоялся канон»

Евгений Марголит о том, как советские режиссеры не совпадали с линией партии

Weekend
Анна Хилькевич: «То, что нам нужно, обязательно придет» Анна Хилькевич: «То, что нам нужно, обязательно придет»

Актриса Анна Хилькевич уже вышла навстречу всему хорошему

VOICE
Марвин Марвин

Правила жизни параноидального андроида Марвина

Правила жизни
От игры в Го до осознания себя: изменит ли искусственный разум мир людей От игры в Го до осознания себя: изменит ли искусственный разум мир людей

Футуролог и писатель Сергей Переслегин о перспективах ИИ

ФедералПресс
Знакомые все лица: зачем городу нужны системы автоматического распознавания лиц Знакомые все лица: зачем городу нужны системы автоматического распознавания лиц

Что такое мегаполис будущего?

ТехИнсайдер
Перспективы туризма на Чукотке: маршруты, мифы и природа Перспективы туризма на Чукотке: маршруты, мифы и природа

Чукотка активно развивает сферу туризма и восстанавливает турпоток

ФедералПресс
10 неожиданных вопросов к Тане Ткачук из группы «Моя Мишель» 10 неожиданных вопросов к Тане Ткачук из группы «Моя Мишель»

Таня Ткачук вспомнила детство, поделилась мудростью и закончила несколько фраз

VOICE
Инвестиции в ИИ: как заработать на инновациях Инвестиции в ИИ: как заработать на инновациях

В акции каких игроков на рынке ИИ лучше всего вложиться?

ФедералПресс
Открыть в приложении