Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Инвайт одобрения: какие социальные триггеры помогли Clubhouse набрать миллионы пользователей Инвайт одобрения: какие социальные триггеры помогли Clubhouse набрать миллионы пользователей

Clubhouse и забытые стратегии вирусного продвижения

Forbes
Между «Золотым глобусом» и «Оскаром»: лучшие фильмы 2020 года Между «Золотым глобусом» и «Оскаром»: лучшие фильмы 2020 года

Самые яркие фильмы прошедшего года

Cosmopolitan
Похудеть на 20 кг и держать вес уже 15 лет: реальная история нашей читательницы Похудеть на 20 кг и держать вес уже 15 лет: реальная история нашей читательницы

Наша героиня сумела справиться с собой и достигла потрясающих результатов!

Cosmopolitan
Гатлинг-ган — пулемет, который не был пулеметом Гатлинг-ган — пулемет, который не был пулеметом

История оружия, которое сегодня все знают под именем «Гатлинг-ган»

Maxim
Ольга Бузова: «Мое место никто не займет» Ольга Бузова: «Мое место никто не займет»

Ольга Бузова рассказала о том, как относится к денежным подаркам

ЖАРА Magazine
Технология ABS: как не забуксовать в продажах Технология ABS: как не забуксовать в продажах

Что такое account-based selling и как этот инструмент помогает в продажах

Forbes
Почему жертва не «сама виновата»: объясняем в картинках Почему жертва не «сама виновата»: объясняем в картинках

Объясняем на примере сериалов и фильмов, почему «сама виновата» — полная чушь

Cosmopolitan
Зачем смотреть «Землю кочевников» Хлои Чжао — фильм об американском мифе Зачем смотреть «Землю кочевников» Хлои Чжао — фильм об американском мифе

«Земля кочевников» Хлои Чжао — лучший фильм любого года

РБК
Статный парень с обезличенным контентом: как 23-летний спортсмен стал самым крупным тиктокером в России Статный парень с обезличенным контентом: как 23-летний спортсмен стал самым крупным тиктокером в России

Как тиктокер Кирилл Колесников привлек миллионы людей к своему творчеству

Forbes
Новые Медичи Новые Медичи

Глава Tod’s Диего Делла Валле выделил €25 млн на реставрацию римского Колизея

Forbes
6 вещей, которые нельзя хранить в кошельке 6 вещей, которые нельзя хранить в кошельке

Все они хоть раз побывали в твоем бумажнике. А зря!

Maxim
4 вида эпиляции, которые избавят от волос навсегда 4 вида эпиляции, которые избавят от волос навсегда

Можно ли сделать кожу идеально гладкой на всю жизнь и стоит ли игра свеч?

Cosmopolitan
Чем полезно чтение вслух: 8 преимуществ важной литературной привычки Чем полезно чтение вслух: 8 преимуществ важной литературной привычки

Чтение вслух — еще один верный способ прокачки себя

Playboy
Природный прототип Природный прототип

Главным поставщиком идей нередко становится природа

Вокруг света
Умерла по дороге на виселицу: как и за что казнят женщин в Иране Умерла по дороге на виселицу: как и за что казнят женщин в Иране

За что иранок приговаривают к смерти?

Cosmopolitan
Bvlgari & Элизабет Bvlgari & Элизабет

Элизабет Тейлор считала себя невластной над украшениями

Grazia
OMAD-диета OMAD-диета

OMAD – одна из самых популярных на западе диет

Худеем правильно
Самые первые автомобили известных компаний Самые первые автомобили известных компаний

Первые модели крупнейших современных автомобилестроителей

Популярная механика
Мэй Маск: «Я каждый день работаю над собой. И это очень не просто» Мэй Маск: «Я каждый день работаю над собой. И это очень не просто»

Мэй Маск прекрасно ориентируется в вопросах лишнего веса и правильного питания

Худеем правильно
Триллер времен распада СССР: что связывает мафиозные банды Нью-Йорка и водку «Кремлевская» Триллер времен распада СССР: что связывает мафиозные банды Нью-Йорка и водку «Кремлевская»

Главы из книги «Новейшая история России в 14 бутылках водки»

Forbes
Комета Борисова оказалась реликтом экзопланетной системы Комета Борисова оказалась реликтом экзопланетной системы

До встречи с Солнцем комета оставалась нетронутой с момента своего образования

N+1
Пытка хэви-металом и ещё три «усиленные техники допроса», используемые ЦРУ Пытка хэви-металом и ещё три «усиленные техники допроса», используемые ЦРУ

«Расширенные методы допроса» — завуалированное название пыток

Maxim
Сельдерей заслуживает хлопот! Сельдерей заслуживает хлопот!

Вы любите сельдерей?

Наука и жизнь
Дело не в деньгах: почему в России не получается создавать премиальные бьюти-бренды Дело не в деньгах: почему в России не получается создавать премиальные бьюти-бренды

Отсутствие инвестиций, внутренние проблемы рынка — проблемы бьюти-индустрии

Forbes
Весеннее обновление: как перекрасить стены, если вы никогда этого не делали, — 5 простых шагов Весеннее обновление: как перекрасить стены, если вы никогда этого не делали, — 5 простых шагов

Как самостоятельно перекрасить стены

Esquire
Изменилось ли со времен Горбачева массовое представление о свободе в России Изменилось ли со времен Горбачева массовое представление о свободе в России

Какие свободы уже стали народными и укоренились в качестве нормы?

СНОБ
Живут без еды и воды: бретарианцы и их смертельная диета Живут без еды и воды: бретарианцы и их смертельная диета

Откуда взялось бретарианство, что действительно едят солнцееды

Cosmopolitan
Мосгорсуд отказался освобождать Навального по требованию ЕСПЧ. Так можно? Разбираемся с юристами Мосгорсуд отказался освобождать Навального по требованию ЕСПЧ. Так можно? Разбираемся с юристами

Может ли Россия игнорировать решения Страсбургского суда

СНОБ
Долгожданная «Лига справедливости» Зака Снайдера: 4 супергеройских часа периода упадка Долгожданная «Лига справедливости» Зака Снайдера: 4 супергеройских часа периода упадка

Нужен ли супергероике такой хронометраж и можно ли привнести что-то новое в жанр

Esquire
Сотни сил хотят на трек: как новый Bentley ищет баланс между драйвом и комфортом Сотни сил хотят на трек: как новый Bentley ищет баланс между драйвом и комфортом

Мы прокатились по ночной Москве на Bentley Flying Spur и делимся впечатлениями

Forbes
Открыть в приложении