Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

5 причин, по которым Stripe стал самым дорогим стартапом США 5 причин, по которым Stripe стал самым дорогим стартапом США

Пять правил, которые помогли Stripe стать самым дорогостоящим стартапом США

Inc.
Природный прототип Природный прототип

Главным поставщиком идей нередко становится природа

Вокруг света
10 минералов, способных вас убить 10 минералов, способных вас убить

Красивые и безопасные на вид минералы могут быть смертельно опасны

Популярная механика
Haval H9. Внедорожник с кровавой подсветкой Haval H9. Внедорожник с кровавой подсветкой

Тест-драйв внедорожника Haval H9

4x4 Club
Звездные разлучники: Безруков, Жигунов и другие актеры, которые увели чужих жен Звездные разлучники: Безруков, Жигунов и другие актеры, которые увели чужих жен

Под обаяние харизматичных артистов попадают многие поклонницы

Cosmopolitan
Просто добавьте спокойствия Просто добавьте спокойствия

Пять советов, как сохранять спокойствие в трудные и стрессовые моменты

Здоровье
Диета на детском питании: можно ли есть пюре в баночках и худеть Диета на детском питании: можно ли есть пюре в баночках и худеть

Диета на детском питании существует и уже завоевала популярность у звезд

Cosmopolitan
Виды на космос Виды на космос

Сложно сказать, когда человечество впервые захотело попасть в космос

Вокруг света
Закрыть гештальт: как Лев Хасис строит партнерства ради торговых и платежных сервисов «Сбера» Закрыть гештальт: как Лев Хасис строит партнерства ради торговых и платежных сервисов «Сбера»

Как Лев Хасис строит экосистему и почему раз за разом терпит неудачи?

Forbes
От романа Яхиной до истории русских травести: 10 главных книг весны От романа Яхиной до истории русских травести: 10 главных книг весны

Писатель и литературный критик Сергей Кумыш выбрал 10 новых книг

РБК
Самые первые фильмы ужасов разных стран Самые первые фильмы ужасов разных стран

Впервые «Вий» в России был снят на кинопленку куда как раньше, чем все думают

Maxim
Гагарин. Космос — последняя мечта человечества Гагарин. Космос — последняя мечта человечества

К годовщине полета Юрия Гагарина: каким он был и о чем мечтал. Часть 1

Esquire
Тайный роман с Челентано и ранние роды: 5 удивительных фактов об Орнелле Мути Тайный роман с Челентано и ранние роды: 5 удивительных фактов об Орнелле Мути

Итальянская актриса Орнелла Мути покорила сердца миллионов мужчин

Cosmopolitan
Рухнет ли британская монархия после интервью принца Гарри и Меган Маркл Рухнет ли британская монархия после интервью принца Гарри и Меган Маркл

Как англичане отреагировали на откровения герцогини и внука Елизаветы II

СНОБ
От скопцов до тюкальщиков: хит-парад сект Российской империи От скопцов до тюкальщиков: хит-парад сект Российской империи

Бывали времена, когда просторы Руси населяли очень диковинные православные секты

Maxim
Как саентология уничтожала своих врагов Как саентология уничтожала своих врагов

Наиболее яркие случаи борьбы сайентологии с неверными

Weekend
Ешь шоколад, пей джин, игнорируй критику: секреты долголетия Елизаветы II Ешь шоколад, пей джин, игнорируй критику: секреты долголетия Елизаветы II

Чему же королева Елизаветы II обязана своим долголетием и добрым здравием?

Cosmopolitan
Что мешает похудеть именно вам? Что мешает похудеть именно вам?

Как выйти из замкнутого круга тем, кто не может похудеть

Здоровье
Замена единственного нуклеотида помогла арктическим сапсанам увеличить дальность миграций Замена единственного нуклеотида помогла арктическим сапсанам увеличить дальность миграций

Особый вариант гена ADCY8 улучшил долговременную память сапсанов

N+1
Сломанная шея и порез артерии: жуткие трагедии на спортивных соревнованиях Сломанная шея и порез артерии: жуткие трагедии на спортивных соревнованиях

Трагедии, которые случились с этими спортсменами, по-настоящему шокировали

Cosmopolitan
Игры с разумом Игры с разумом

На что гаджеты действительно способны и что нам за это будет

Vogue
Гагарин. Космос — последняя мечта человечества Гагарин. Космос — последняя мечта человечества

К годовщине полета Юрия Гагарина: каким он был и о чем мечтал. Часть 2

Esquire
«Хочешь есть — попей воды» и другие популярные фитнес-мифы о голоде и питании «Хочешь есть — попей воды» и другие популярные фитнес-мифы о голоде и питании

Как мифы о голоде и питании угрожают нашему здоровью?

Psychologies
«Мы не альтруисты»: как суррогатные матери в России зарабатывают миллионы «Мы не альтруисты»: как суррогатные матери в России зарабатывают миллионы

Что двигает биородителями и как относиться к суррогатному материнству?

Cosmopolitan
Ученые смоделировали работу шестерней Антикитерского механизма Ученые смоделировали работу шестерней Антикитерского механизма

Антикитерский механизм — античный прибор для расчета движения небесных тел

N+1
7 привычек по-настоящему интересных людей 7 привычек по-настоящему интересных людей

Привычки, которые отличают действительно интересных собеседников

Psychologies
Строим трансформатор Теслы на дому Строим трансформатор Теслы на дому

Резонансный трансформатор, известный также как «катушка Теслы»

Популярная механика
Как скрыть друзей в ВК от других пользователей Как скрыть друзей в ВК от других пользователей

Как скрыть друзей в ВК через компьютер или смартфон на Android или iOS

CHIP
Ланкаширский хилер Ланкаширский хилер

Ланкаширский хилер — очень забавная и симпатичная собака

Weekend
Богатая фамилия Богатая фамилия

Топ-20 семейных итальянских бизнесов

Forbes
Открыть в приложении