Что собой представляет проект Ayana и какие возможности он открывает

ФедералПрессHi-Tech

Разработчик приложения Ayana: «Языки и культуру малых народов спасет искусственный интеллект»

Станислав Казаченко

Современная жизнь считается угрозой для культур коренных малочисленных народов Севера. Например, из 37 тысяч живущих в России эвенков лишь 5 тысяч на достаточном уровне владеют родным языком. Однако технический прогресс может быть и помощником в сохранении традиционного уклада. Примером тому может служить Ayana — голосовой помощник на эвенкийском языке, аналог известных «Алисы» и «Маруси». О том, что собой представляет проект и какие возможности он открывает, рассказал разработчик Николай Апросимов.

Роботы говорят по-эвенкийски

С чего началась работа над вашим проектом?

Впервые такая идея появилась в 2019 году, а непосредственная работа началась год спустя, когда мы выиграли грант министерства по развитию Арктики РС(Я). На тот момент речь шла только о создании переводчика с русского на эвенкийский язык. Мы искали способы реализации, перебирали варианты и в ходе работы стали погружаться в особенности функционирования искусственного интеллекта. И когда в процессе мы услышали, как машина впервые в истории сказала «мэнду» (что по-эвенкийски значит «привет»), мы были шокированы. Поняли, что произошло нечто невообразимое. И главное, мы осознали, что появилась прямая надежда на сохранение нашего языка.

А дальше оказалось, что речь может идти больше чем об обычном переводчике в мобильном приложении. Создается как будто искусственное ядро родного языка, где можно собрать массив данных, включающий не только слова, но и культурный код. Так же, как у «Алисы», можно попросить включить музыку или можно будет сделать голосовой запрос об эвенкийской кухне, национальной одежде, о знаменитых эвенках. Конечно, проект вызвал эффект разорвавшейся бомбы, но в то же время мы получили достаточно много замечаний.

Для реализации подобного проекта нужен целый набор компетенций — от знания эвенкийского языка до навыков программирования. Как вы их получили и как формировалась команда?

Начну с того, что по профессии я не программист и не лингвист, а эколог. И больше того, хоть и принадлежу к эвенкийскому народу и являюсь потомком известного рода Апросимовых, долгое время нашим языком на должном уровне не владел. Впрочем, именно это и дало мне понимание, как важно сохранение национальной культуры и что для этого могут быть полезны современные технологии.

Все началось с просмотров тематических роликов на YouTube и изучения Google-переводчика. Дальше пришлось очень много учиться. Тем более что на первоначальном этапе у нас и не было ресурсов набрать широкую команду с разнообразными компетенциями. В том числе приходилось много консультироваться на сайте профессионалов в области ИТ — Habr, также в блог-канале «Теплица социальных технологий»*. Данные о языке брали с сайта Еvengus, который ведут лингвисты. Конечно, не всегда получалось успешно, была и своя череда неудач, в какой-то момент стало казаться, что на таком редком языке, как эвенкийский, вообще невозможно запустить работу с применением NLU («естественного распознавания языка». — Прим. ред.). NLU было необходимо для запуска именно голосового решения с последующим голосовым ответом пользователю.

* Министерством юстиции РФ внесен в реестр иностранных агентов.

Помощь пришла неожиданно — из Великобритании. Я много общался в профильных сообществах, и один собеседник из этой страны просто отправил видеосообщение и рассказал, что есть такой код, такая разметка, где можно кастомизировать речь, отправил мне репозитории. Мы начали работу и впервые смогли не только озвучить, но и провести кастомизацию по изучению эвенкийского языка. Именно тогда случился тот яркий момент, когда машина впервые сказала слова на эвенкийском языке. Мы стали применять разметку искусственного интеллекта (AIML), на основе которой созданы популярные языковые ассистенты по всему миру.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Инвестиции в импортозамещение: их эффект для развития российской промышленности Инвестиции в импортозамещение: их эффект для развития российской промышленности

Какие инвестиции направляются на реализацию импортозамещающих производств сейчас

ФедералПресс
Алан Тьюринг Алан Тьюринг

Правила жизни математика, логика, криптографа Алана Тьюринга

Правила жизни
Сладкая жизнь Сладкая жизнь

Белок – но сладкий. Может ли такое быть? Да!

ТехИнсайдер
Трехмерные художники Трехмерные художники

Почему не «выстрелили» программы для рисования в трех измерениях?

ТехИнсайдер
Умирающая хромосома Умирающая хромосома

Y-хромосома — cамая маленькая в человеческом геноме, она продолжает уменьшаться

ТехИнсайдер
Законное преступление: Как зарабатывают миллионы на фотографиях в интернете Законное преступление: Как зарабатывают миллионы на фотографиях в интернете

В России набирает обороты новая схема заработка на фотографиях в интернете

ФедералПресс
Между нами, девочками Между нами, девочками

Как визит к гинекологу помогает решить проблемы с кожей

Лиза
Куклы романтизма Куклы романтизма

Есть ли в мире бездушной и безжалостной техники место для романтиков?

Правила жизни
Роскошь для себя Роскошь для себя

Это не первое интервью с Александрой Ребенок. Но первое в таком формате

OK!
Парадоксальная угроза Парадоксальная угроза

Одна из самых интересных битв вокруг ИИ развернется не в области техники

Правила жизни
Радиоактивность, которая лечит Радиоактивность, которая лечит

Ядерная медицина — одно из наиболее динамично развивающихся направлений науки

Наука
Первый Берлинский кризис Первый Берлинский кризис

Берлинский кризис стал первым крупным испытанием на прочность послевоенного мира

Дилетант
Города для жизни Города для жизни

Словосочетание «комфортная городская среда» давно звучит из уст чиновников

Эксперт
Близкий Дальний Восток, новая Анапа и поезд вместо ракет Близкий Дальний Восток, новая Анапа и поезд вместо ракет

Как мы будем путешествовать по России через 30 лет

РБК
Это мы не проходили Это мы не проходили

Высшее образование становится бессмысленным, но учиться приходится всю жизнь

Men Today
Мой мальчик Мой мальчик

Пары, в которых мужчина заметно моложе женщины, вызывают неоднозначную реакцию

VOICE
Гимназия Санкт-Петербургской Академии наук: создание и становление Гимназия Санкт-Петербургской Академии наук: создание и становление

История первой гимназии Санкт-Петербургской Академии наук

Знание – сила
Татьяна Правдина: «Когда Зяма смотрел свои фильмы, всегда говорил: «Это — не то!» Татьяна Правдина: «Когда Зяма смотрел свои фильмы, всегда говорил: «Это — не то!»

Актеру Зиновию Гердту было 44 года, а переводчице Татьяне Правдиной — 32

Коллекция. Караван историй
Человек растерянный Человек растерянный

Как Феллини и Мастроянни придумали нового героя послевоенной Европы

Weekend
Ругаться буду! Ругаться буду!

Почему нам так нравится скандалить в соцсетях (и стоит ли этим заниматься)

VOICE
Революция в астрономии XX века Революция в астрономии XX века

Виктор Амбарцумян — основоположник теории астрофизики в СССР

Знание – сила
Больше света Больше света

Как управлять люминесценцией?

Наука
Главные фильмы Венеции-2023: экстраординарный Лантимос, новая Коппола и фильмы про киллеров Главные фильмы Венеции-2023: экстраординарный Лантимос, новая Коппола и фильмы про киллеров

На какие фильмы 80-ого кинофестиваля в Венеции следует обратить внимание?

Правила жизни
Промышленным гигантам нужны ферменты Промышленным гигантам нужны ферменты

Ученые создали новую технологию получения ферментов для промышленности

Наука
Евгений Липовицкий: Как я открыл вселенную автохимии Евгений Липовицкий: Как я открыл вселенную автохимии

Таинственный мир моторных масел, допусков, сертификаторов и других жидкостей

4x4 Club
От игры в Го до осознания себя: изменит ли искусственный разум мир людей От игры в Го до осознания себя: изменит ли искусственный разум мир людей

Футуролог и писатель Сергей Переслегин о перспективах ИИ

ФедералПресс
Ядерные полигоны и могильники: где хранят радиоактивные отходы Ядерные полигоны и могильники: где хранят радиоактивные отходы

Какую опасность для окружающего мира представляют радиоактивные отходы?

ФедералПресс
«С женщинами мне как-то проще» «С женщинами мне как-то проще»

Дарья Савельева о своих ролях в двух ярких дебютах 2023 года

Weekend
«Диагноз поставлен»: 3 шага, чтобы не разрушить отношения при психическом расстройстве «Диагноз поставлен»: 3 шага, чтобы не разрушить отношения при психическом расстройстве

Как решить проблемы в отношениях, связанные с психическим здоровьем?

Psychologies
Чувство дома Чувство дома

Как Feel Beit объединяет разные культуры

Seasons of life
Открыть в приложении