Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Дар неудачи Дар неудачи

Отпустите детей – они сами справятся

kiozk originals
Мосгорсуд отказался освобождать Навального по требованию ЕСПЧ. Так можно? Разбираемся с юристами Мосгорсуд отказался освобождать Навального по требованию ЕСПЧ. Так можно? Разбираемся с юристами

Может ли Россия игнорировать решения Страсбургского суда

СНОБ
Черная акула оказалась самым крупным светящимся позвоночным Черная акула оказалась самым крупным светящимся позвоночным

Вероятно, она использует биолюминесценцию, чтобы незаметно подкрасться к жертве

N+1
Ген жирафа защитил мышей от гипертонии и сделал их кости прочнее Ген жирафа защитил мышей от гипертонии и сделал их кости прочнее

Биологи выявили гены, которые позволяют жирафам решать физиологические проблемы

N+1
Приложение без фильтров: станет ли Dispo новым Instagram для зумеров Приложение без фильтров: станет ли Dispo новым Instagram для зумеров

Как создали Dispo и что сделало его популярным среди молодежи?

Forbes
«Сегодня на iPhone снимают даже обложки TIME»: фотограф Константин Чалабов о первых онлайн-съемках «Сегодня на iPhone снимают даже обложки TIME»: фотограф Константин Чалабов о первых онлайн-съемках

Фотограф Константин Чалабов о соединении творческого и технологического

Esquire
Волшебник-неудачник: что осталось от политического наследия Михаила Горбачева Волшебник-неудачник: что осталось от политического наследия Михаила Горбачева

Закончив заведомо проигранную войну, Горбачев добился выигрыша для всех

Forbes
Как скрыть друзей в ВК от других пользователей Как скрыть друзей в ВК от других пользователей

Как скрыть друзей в ВК через компьютер или смартфон на Android или iOS

CHIP
Повторил судьбу Theranos: финтех-стартап Greensill Capital шёл к IPO на $7 млрд, но закрылся после скандалов с кредитами Повторил судьбу Theranos: финтех-стартап Greensill Capital шёл к IPO на $7 млрд, но закрылся после скандалов с кредитами

Сын фермеров хотел помочь малому бизнесу и придумал схему с «продажей» кредитов

VC.RU
«Мы привязаны друг к другу насмерть»: история любви Раисы и Михаила Горбачевых «Мы привязаны друг к другу насмерть»: история любви Раисы и Михаила Горбачевых

Михаил Горбачев в своей жизни любил только одну женщину

Cosmopolitan
Крах Archegos: сигнал «денежным мешкам» или напоминание о риске Крах Archegos: сигнал «денежным мешкам» или напоминание о риске

Подробно разбираем ситуацию с Archegos Capital Management

Forbes
Cadillac XT6. Всё включено Cadillac XT6. Всё включено

К Cadillac у нас отношение особое

4x4 Club
10 самых распространенных заблуждений об алкоголе 10 самых распространенных заблуждений об алкоголе

Самые распространенные заблуждения об алкоголе

Maxim
Конфликт Меган Маркл и Британии: за что все не любят жену принца Гарри Конфликт Меган Маркл и Британии: за что все не любят жену принца Гарри

По каким причинам Меган Маркл вызвала всеобщую ненависть?

Cosmopolitan
Как делать заметки и конспекты, чтобы лучше учиться Как делать заметки и конспекты, чтобы лучше учиться

Правильное ведение записей помогает эффективнее усваивать информацию

Psychologies
3 практики для борьбы с негативом 3 практики для борьбы с негативом

Практики осознанности поддерживают нас, когда тревога не дает дышать

Psychologies
Жир льва, мышьяк, радий и другие шокирующие ингредиенты в косметике прошлого Жир льва, мышьяк, радий и другие шокирующие ингредиенты в косметике прошлого

Самые необычные факты о бьюти-трендах Древнего мира и Средневековья

Cosmopolitan
Звездные мачехи: Ионова, Бородина и другие россиянки, полюбившие детей мужа Звездные мачехи: Ионова, Бородина и другие россиянки, полюбившие детей мужа

Эти знаменитые красотки смогли принять детей супруга от прошлого союза

Cosmopolitan
Новая BMW 4: три мнения о купе, которое критикуют за ноздри Новая BMW 4: три мнения о купе, которое критикуют за ноздри

Впечатления от самой одиозной BMW последних лет

РБК
IPO с нулевой суммой IPO с нулевой суммой

Кто платит за праздник доходностей на рынке первичных размещений

Forbes
Правила жизни Гэри Олдмана Правила жизни Гэри Олдмана

Актер, Лондон, 63 года

Esquire
Что делать, если вас все время перебивают Что делать, если вас все время перебивают

Из-за чего собеседник вас перебивает и как изменить ситуацию?

Psychologies
Виртуальный секс Виртуальный секс

«Популярная механика» протестировала первую в мире виртуальную любовницу

Популярная механика
Спаржа Спаржа

Готовьтесь, в апреле начинается сезон спаржи

Здоровье
10 неожиданно радиоактивных вещей и мест 10 неожиданно радиоактивных вещей и мест

Повседневные вещи содержат радиоактивные изотопы в микроскопическом количестве

Популярная механика
Убеждения и выгоды, которые заставляют нас оставаться в позиции жертвы Убеждения и выгоды, которые заставляют нас оставаться в позиции жертвы

Почему мы иногда остаемся в позиции жертвы и как это изменить?

Psychologies
Повторит ли «Девушка, подающая надежды» успех «Джокера»? Повторит ли «Девушка, подающая надежды» успех «Джокера»?

Кэри Маллиган номинирована на «Оскар» за роль в триллере о мести

Esquire
Вопрос психологу: что делать, если поставленные цели никогда не воплощаются в жизнь? Вопрос психологу: что делать, если поставленные цели никогда не воплощаются в жизнь?

Психолог объясняет механику правильной постановки целей

Esquire
Роман Должанский: Одоевское трехлучье Роман Должанский: Одоевское трехлучье

Новые главы из будущей книги Романа Должанского о путешествиях по России

СНОБ
Неуязвимый Набоков: почему автор «Лолиты» все еще актуален Неуязвимый Набоков: почему автор «Лолиты» все еще актуален

Почему Владимир Набоков снова оказался в центре внимания

РБК
Открыть в приложении