Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Дар неудачи Дар неудачи

Отпустите детей – они сами справятся

kiozk originals
Все должно случиться Все должно случиться

Глеб Пускепалис впервые вышел на сцену в 1 год и с тех пор оттуда не уходит

OK!
Не только морковь: 11 продуктов для острого зрения Не только морковь: 11 продуктов для острого зрения

Продукты, которые положительно влияют на зрение

РБК
История «интернет-королевы» Мэри Микер: инвестор, которая предсказывает будущее Кремниевой долины История «интернет-королевы» Мэри Микер: инвестор, которая предсказывает будущее Кремниевой долины

Мэри Микер предсказала бум доткомов и пережила их крах

VC.RU
10 вещей, которые должны быть в шкафу каждого взрослого мужчины 10 вещей, которые должны быть в шкафу каждого взрослого мужчины

Чтобы понять, взрослый ты мужчина или нет, достаточно влезть к себе в шкаф

Maxim
Женское дело Женское дело

Анджелина Джоли — об осознанности, воспитании детей и борьбе за права беженцев

Vogue
Покорили Европу и Голливуд: российские актрисы, добившиеся успеха за границей Покорили Европу и Голливуд: российские актрисы, добившиеся успеха за границей

Светлана Ходченкова и не только: русские актрисы, довившиеся успеха за рубежом

Cosmopolitan
Распятие на кресте, секретный остров в стиле «Пилы» и еще десять безумных наказаний за жульничество в видеоиграх Распятие на кресте, секретный остров в стиле «Пилы» и еще десять безумных наказаний за жульничество в видеоиграх

Наказания для читеров: от крайне жестоких до забавных и милых

Популярная механика
Почему жертва не «сама виновата»: объясняем в картинках Почему жертва не «сама виновата»: объясняем в картинках

Объясняем на примере сериалов и фильмов, почему «сама виновата» — полная чушь

Cosmopolitan
История американской подлодки, которая попала в себя собственной торпедой История американской подлодки, которая попала в себя собственной торпедой

События звучат как анекдот, но происшествие 1944 года совсем не анекдотичное

Maxim
Топ-6 приложений для изучения английского языка Топ-6 приложений для изучения английского языка

Все, что понадобится для обучения английскому языку — смартфон и наушники

CHIP
Роскошь передвижения или «тяжелый люкс» в мире туризма Роскошь передвижения или «тяжелый люкс» в мире туризма

Как лучше потратить сэкономленные за локдаун пиастры?

Playboy
Гибель без крови Гибель без крови

Нехватка продовольствия не раз становилась причиной массовой гибели людей

Дилетант
Как прививать знания ребенку, выросшему с телефоном в руках? Попробуйте микрообучение Как прививать знания ребенку, выросшему с телефоном в руках? Попробуйте микрообучение

Развить усидчивость детям поможет микрообучение

Psychologies
Повторит ли «Девушка, подающая надежды» успех «Джокера»? Повторит ли «Девушка, подающая надежды» успех «Джокера»?

Кэри Маллиган номинирована на «Оскар» за роль в триллере о мести

Esquire
Что делать, если вас все время перебивают Что делать, если вас все время перебивают

Из-за чего собеседник вас перебивает и как изменить ситуацию?

Psychologies
Квантовый ключ преодолел расстояние в 511 километров Квантовый ключ преодолел расстояние в 511 километров

Квантовая криптография пока все еще далека от массового распространения

N+1
Самые крутые фильмы про супергероев: список 20 лучших от Playboy Самые крутые фильмы про супергероев: список 20 лучших от Playboy

Подборка культовых супергеройских картин, обязательных к просмотру

Playboy
Хранилище генов миллионов биологических видов в недрах Луны: самый амбициозный проект будущего Хранилище генов миллионов биологических видов в недрах Луны: самый амбициозный проект будущего

Лунный ковчег — колоссальное хранилище биологических видов Земли

Популярная механика
Как я учился врать: история человека, всегда говорившего правду Как я учился врать: история человека, всегда говорившего правду

Майкл вырос в семье, в которой было не принято врать

Reminder
Автомобили на сжатом воздухе: плюсы и минусы Автомобили на сжатом воздухе: плюсы и минусы

Почему пневмокары внезапно вошли в моду?

Популярная механика
5 признаков здорового стартапа. Неочевидные советы от инвестора 5 признаков здорового стартапа. Неочевидные советы от инвестора

5 неочевидных вещей, которые сделают стартап привлекательным для инвесторов

Inc.
Бывшая узница скопинского маньяка: «Главное — никогда не мириться с обстоятельствами» Бывшая узница скопинского маньяка: «Главное — никогда не мириться с обстоятельствами»

Похищение, насилие, годы, проведенные в бункере всего в 90 километрах от дома

Psychologies
Накладное дело Накладное дело

Наталья Иншакова — о новой волне популярности виниров

Tatler
Эрик Булатов. Светлое и темное Эрик Булатов. Светлое и темное

Эрик Булатов уверен, что в основе мира лежит свет

Караван историй
Как отвечать на детские вопросы Как отвечать на детские вопросы

Как отвечать на детские вопросы, чтобы не напугать и не обмануть ребенка?

Cosmopolitan
Скульптурные торсы в деле: в Пушкинском сняли блокбастер с Дианой Вишневой Скульптурные торсы в деле: в Пушкинском сняли блокбастер с Дианой Вишневой

«Слепок» — фильм-балет, снятый в залах ГМИИ имени Пушкина

Forbes
10 минералов, способных вас убить 10 минералов, способных вас убить

Красивые и безопасные на вид минералы могут быть смертельно опасны

Популярная механика
5 причин пересмотреть «50 оттенков серого» 5 причин пересмотреть «50 оттенков серого»

Пора вновь заглянуть в тайную комнату мистера Грея!

Cosmopolitan
9 лучших мобильных приложений для женщин 9 лучших мобильных приложений для женщин

Собрали полезные и универсальные приложения, которые пригодятся каждой девушке

CHIP
Открыть в приложении