Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Мозг, исцеляющий себя Мозг, исцеляющий себя

Реальные истории людей, которые победили болезни и преобразили свой мозг

kiozk originals
Бальзам на душу — лучшие оригинальные проекты «Нетфликс» 2021 года Бальзам на душу — лучшие оригинальные проекты «Нетфликс» 2021 года

Короче, заходят в бар Мартин Скорсезе и Фран Лебовиц... Нет, без шуток. Это шоу

Esquire
Умная колонка подслушала сердцебиение Умная колонка подслушала сердцебиение

Это позволяет отслеживать нарушения вариабельности сердечного ритма

N+1
«У меня получается только то, что мне хочется» «У меня получается только то, что мне хочется»

Виктория Толстоганова о самодостаточности и свободе

OK!
«Звук: слушать, слышать, наблюдать» «Звук: слушать, слышать, наблюдать»

Отрывок из книги Мишеля Шиона о том, что такое звук

N+1
Почему дергается глаз и как это прекратить Почему дергается глаз и как это прекратить

Офтальмологи и неврологи объясняют, как быть в ситуации, когда дергается глаз

РБК
Ловкость рук Ловкость рук

Заменит ли искусственный интеллект человеческий разум и ручной труд?

Grazia
Как принять себя и полюбить: руководство по заботе о классном парне по имени «ты» Как принять себя и полюбить: руководство по заботе о классном парне по имени «ты»

Чем вредно отсутствие любви к себе?

Playboy
Праздник девочек в Японии: как его отмечают и чему он может нас научить Праздник девочек в Японии: как его отмечают и чему он может нас научить

В третий день третьего месяца японцы ежегодно отмечают Праздник девочек

Psychologies
«Мы изранены!»: Меган Маркл, Наоми Кэмпбелл и другие звезды, пережившие расизм «Мы изранены!»: Меган Маркл, Наоми Кэмпбелл и другие звезды, пережившие расизм

В нашем многогранном мире до сих пор встречаются случаи нетерпимости

Cosmopolitan
Брильянты, балы и браки по расчету: британские сериалы про высшее общество Брильянты, балы и браки по расчету: британские сериалы про высшее общество

Британские сериалы о высшем свете

Cosmopolitan
Природа изменений Природа изменений

Как глобальное потепление отражается на нашей жизни и образе мыслей

РБК
Мужская крепость Мужская крепость

Брутальный мужской интерьер для холостяка

SALON-Interior
Мамы нарасхват: пять российских многодетных звезд, родивших от разных мужчин Мамы нарасхват: пять российских многодетных звезд, родивших от разных мужчин

Эти знаменитые красотки успешно совмещают карьеру и воспитание детей

Cosmopolitan
Кефир и свекла: 7 суперфудов, которые точно есть на твоей кухне Кефир и свекла: 7 суперфудов, которые точно есть на твоей кухне

Обязательно ли покупать суперфуды по космическим ценам?

Cosmopolitan
«Чем больше мужчина вынужден притворяться сильным, тем слабее его эго»: почему мы все должны быть феминистами «Чем больше мужчина вынужден притворяться сильным, тем слабее его эго»: почему мы все должны быть феминистами

Отрывок из книги «Мы все должны быть феминистами» Чимаманды Нгози Адичи

Forbes
Как поддержать себя, если вы страдаете хроническим заболеванием Как поддержать себя, если вы страдаете хроническим заболеванием

Что можно сделать, оказавшись лицом к лицу с болезнью?

Psychologies
Почему смартфоны разряжаются на морозе, и что с этим делать Почему смартфоны разряжаются на морозе, и что с этим делать

Почему смартфоны могут перестать работать при минусовых температурах?

Популярная механика
«До 45 лет смешно, а потом начинается»: Елена Новикова — о женском стендапе и сериале «Я не шучу» «До 45 лет смешно, а потом начинается»: Елена Новикова — о женском стендапе и сериале «Я не шучу»

Стеднап-комик Елена Новикова — о съемках, настоящем стендапе и детях

Forbes
Константин Циолковский Константин Циолковский

Правила жизни Константина Циолковского

Esquire
Стелла Маккартни: да, нет, знаю Стелла Маккартни: да, нет, знаю

Цель работы Стеллы Маккартни — нулевое влияние на окружающую среду

Glamour
Почему фильм «Неуместный трах, или Безумное порно» победил на Берлинале Почему фильм «Неуместный трах, или Безумное порно» победил на Берлинале

Триумф румынской картины Раду Жуде «Неуместный трах, или Безумное порно»

РБК
Основал Y Combinator, программировал, написал сотни эссе и картин и продолжил искать себя: история Пола Грэма Основал Y Combinator, программировал, написал сотни эссе и картин и продолжил искать себя: история Пола Грэма

Пересказ эссе Пола Грэма «Над чем я работал»

VC.RU
Две твердыни Две твердыни

Близнецы леди Амелия и Элайза Спенсер дали первое в жизни интервью

Tatler
Под колпаком: как нами управляют приложения для знакомств и родительского контроля Под колпаком: как нами управляют приложения для знакомств и родительского контроля

Не все полезные приложения безвредны

Forbes
Развал «Свалки»: что стало с бизнесом выходцев из Qiwi и BlaBlaCar и почему всё пошло не так Развал «Свалки»: что стало с бизнесом выходцев из Qiwi и BlaBlaCar и почему всё пошло не так

История «Свалки» — сервиса по вывозу вещей, который развалился

VC.RU
Триллер времен распада СССР: что связывает мафиозные банды Нью-Йорка и водку «Кремлевская» Триллер времен распада СССР: что связывает мафиозные банды Нью-Йорка и водку «Кремлевская»

Главы из книги «Новейшая история России в 14 бутылках водки»

Forbes
История огонь: как создатели Merlion оказались за решеткой из-за $4,5 млн и сгоревшего дома История огонь: как создатели Merlion оказались за решеткой из-за $4,5 млн и сгоревшего дома

В российском списке Forbes могут появится сразу три новичка

Forbes
Как казахский железнодорожник стал мировой звездой: история Иманбека Зейкенова Как казахский железнодорожник стал мировой звездой: история Иманбека Зейкенова

Еще совсем недавно имя Иманбека Зейкенова вам вряд ли о чем-то сказало бы

Cosmopolitan
Сделано на пять Сделано на пять

Фотограф Сергей Ананьев показал AD свою новую четырехкомнатную квартиру

AD
Открыть в приложении