Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пластичность мозга Пластичность мозга

Потрясающие факты о том, как мысли способны менять структуру и функции мозга

kiozk originals
Киберпанк-2021 Киберпанк-2021

Проект нового направления в музыкальной индустрии родился на стыке технологий

Популярная механика
Как приземляются самолеты: причины катастроф при посадке Как приземляются самолеты: причины катастроф при посадке

Нештатные ситуации после приземления – бич гражданской авиации

Популярная механика
Не уверен, как прошло первое свидание? 9 признаков, что все было отлично Не уверен, как прошло первое свидание? 9 признаков, что все было отлично

Успешность первого свидания оценить всегда трудно

Playboy
Старшему 50, младшей 28, шестеро умерли: история самой многодетной семьи России Старшему 50, младшей 28, шестеро умерли: история самой многодетной семьи России

Семья Хромых стала самой многодетной в стране и вошла в Книгу рекордов России

Cosmopolitan
Возможно, будет «Рокетбанк» для криптоактивов: интервью с основателями российского NFT-маркетплейса Rarible Возможно, будет «Рокетбанк» для криптоактивов: интервью с основателями российского NFT-маркетплейса Rarible

Интервью с основателями российского NFT-маркетплейса Rarible

VC.RU
Не кормить льва предрассудков: как дочь рабыни в начале ХХ века открыла торговый центр для темнокожих Не кормить льва предрассудков: как дочь рабыни в начале ХХ века открыла торговый центр для темнокожих

История женщины, которая делала деньги сама и помогала зарабатывать другим

Forbes
Идеи подарков на 8 Марта маме, которая сечет фишку: современные и технологичные штуковины специально для нее Идеи подарков на 8 Марта маме, которая сечет фишку: современные и технологичные штуковины специально для нее

Подборка девайсов, которые можно преподнести в подарок маме не только на 8 Марта

Playboy
Генная терапия облегчила боль у мышей Генная терапия облегчила боль у мышей

Ученые с помощью генной терапии смогли снизить болевую чувствительность у мышей

N+1
Связь с будущим Связь с будущим

Как проложить путь в будущее через околоземное пространство

Esquire
Секс на стороне: плюсы и минусы. Отрывок из книги секс-просветителя Маши Халеви «Полиамория. Свобода выбирать» Секс на стороне: плюсы и минусы. Отрывок из книги секс-просветителя Маши Халеви «Полиамория. Свобода выбирать»

Отрывок из книги Маши Халеви, в которой она рассуждает о полиамории

СНОБ
Теплоход «Аншлага» захватили зомби. Подборка 20 лучших хоррор-комедий Теплоход «Аншлага» захватили зомби. Подборка 20 лучших хоррор-комедий

Лучшее из доступных онлайн хоррор-комедий

Esquire
Читаем по руке: как найти и объяснить знаки успеха на ладонях Читаем по руке: как найти и объяснить знаки успеха на ладонях

Анализ линий и знаков на ладонях, отвечающих за карьерный успех

Cosmopolitan
Мэй Маск: «Я каждый день работаю над собой. И это очень не просто» Мэй Маск: «Я каждый день работаю над собой. И это очень не просто»

Мэй Маск прекрасно ориентируется в вопросах лишнего веса и правильного питания

Худеем правильно
Встретились в цирке и не расставались: история любви Юрия и Татьяны Никулиных Встретились в цирке и не расставались: история любви Юрия и Татьяны Никулиных

Юрий и Татьяна Никулины встретились в цирке и не расставались почти полвека

Cosmopolitan
Искусство сборки Искусство сборки

Новая креативная контркультура в мире кастом-байков

Robb Report
Техника обучения Фейнмана Техника обучения Фейнмана

Техника, которая вам подойдет, если вы ищете способ ускорить свое обучение

VC.RU
«Угроза невежеству»: кто такая Аманда Горман, которая читала свою поэму на инаугурации Байдена «Угроза невежеству»: кто такая Аманда Горман, которая читала свою поэму на инаугурации Байдена

Афроамериканка Аманда Горман — первый молодежный национальный поэт-лауреат США

Forbes
Тюрьма Сугамо: культура забвения Тюрьма Сугамо: культура забвения

История первой в Японии тюрьмы, устроенной по европейскому образцу

Дилетант
6 вещей, которые нельзя хранить в кошельке 6 вещей, которые нельзя хранить в кошельке

Все они хоть раз побывали в твоем бумажнике. А зря!

Maxim
10 открытий, сделанных на Марсе 10 открытий, сделанных на Марсе

Что удалось узнать о Марсе за последние годы?

Популярная механика
Рухнет ли британская монархия после интервью принца Гарри и Меган Маркл Рухнет ли британская монархия после интервью принца Гарри и Меган Маркл

Как англичане отреагировали на откровения герцогини и внука Елизаветы II

СНОБ
Спасибо, получила! Спасибо, получила!

Мы много слышали о волшебных оргазмах. Теперь пришло время их испытывать!

Cosmopolitan
Почему мы критикуем себя и как это прекратить Почему мы критикуем себя и как это прекратить

Как отключить голос внутреннего критика?

Psychologies
Умная куртка получит электроэнергию от трения и пота Умная куртка получит электроэнергию от трения и пота

Электроэнергию можно получать непрерывно

N+1
3D-моделирование помогло прочитать древнерусские надписи на стенах собора 3D-моделирование помогло прочитать древнерусские надписи на стенах собора

Ученые смогли восстановить текст древнейшего памятника письменности

Популярная механика
Новые космические бизнесы: Юсеф Хесуани Новые космические бизнесы: Юсеф Хесуани

«В космосе ничего поправить в процессе уже нельзя»

Esquire
Великая Великая

Эксперт по этикету Татьяна Полякова консультирует первых лиц государств

Собака.ru
Глобальный сдвиг или глубочайший кризис: каким будет 2021 год Глобальный сдвиг или глубочайший кризис: каким будет 2021 год

Список главных трендов года

РБК
Яркий цвет, супердлина и блестки: маникюр российских звезд крупным планом Яркий цвет, супердлина и блестки: маникюр российских звезд крупным планом

Наши звезды всегда отличались оригинальным вкусом и чувством стиля

Cosmopolitan
Открыть в приложении