Как ИИ пришел в сервисы Mail.ru Group еще более чем 15 лет назад

Inc.Бизнес

Как ИИ незаметно для пользователей проник в продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает государству, корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России еще в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний-профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришел в сервисы группы компаний еще более чем 15 лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это было очень давно. Когда программист не пишет код, а обучает компьютер — это уже машинное обучение. Кроме того поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Еще одно давнее применение ИИ — это Почта Mail.ru и ее система антиспама. Сначала его делали вручную, потом стали собирать статистику с каких IP-адресов приходят сомнительные письма и блокировать их, потом научили компьютер анализировать текст, и если в нем несколько раз встречались условные слова «бесплатно» и «без смс», то в система включала тревожный сигнал. Кроме этого помогали пользователи отмечая, нежелательные письма как спам.Более сложные примеры — это рекламные технологии, умные ленты социальных сетей и все это есть в Mail.ru Group.

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала Альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить роста российского рынка ИИ.

Звучит сложно, но на практике, это означает партнерство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий и совместное создание продуктов на основе ИИ, которые увеличат объем российского рынка с 198,1 миллиардов рублей рублей до 907,4 миллиардов к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы обучения искусственного интеллекта. Это можно делать с помощью размеченных данных — то есть тех, содержание которых известно. Для разметки данных в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют простые задания. Так для улучшения работы поиска асессоры оценивают насколько документы релевантны запросам пользователей. Также асессоры помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. На основе этой работы алгоритм компьютерного зрения Mail.ru Group научился определяться сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях (например, ВКонтакте и Одноклассниках). В том числе они обучали голосового ассистента Марусю включать музыку. Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский в Mail.ru Group создали подюорку из плейлистов бетатестеров и попросили озвучить все названия.

Сбор датасета с помощью реальных людей долгий и дорогой, поэтому кроме него часто используют обучение ИИ на действиях пользователей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ фильтруются, чтобы исключать из них треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», для отслеживания реакции на контент системе рекомендаций соцсетей. При этом ИИ ничего не знает о содержании контента, но видит реакцию пользователей на него и учится ее предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Символы российской типографики: как Илья Рудерман и Юрий Остроменцкий зарабатывают на своих и чужих шрифтах Символы российской типографики: как Илья Рудерман и Юрий Остроменцкий зарабатывают на своих и чужих шрифтах

Это история о том, как два дизайнера превратили свою страсть в прибыльный бизнес

Inc.
Каким женщинам нравится секс на одну ночь? Каким женщинам нравится секс на одну ночь?

Нравится ли женщина секс на одну ночь

Psychologies
Сама себе враг: как мизогиния в женской среде мешает карьере не меньше гендерной дискриминации Сама себе враг: как мизогиния в женской среде мешает карьере не меньше гендерной дискриминации

Что делает конкуренцию между женщинами токсичной

Forbes
Сотни сил хотят на трек: как новый Bentley ищет баланс между драйвом и комфортом Сотни сил хотят на трек: как новый Bentley ищет баланс между драйвом и комфортом

Мы прокатились по ночной Москве на Bentley Flying Spur и делимся впечатлениями

Forbes
Жажда правды Жажда правды

Журналистское расследование, открывшее миру голодомор

Дилетант
Боюсь, что близость с мамой разрушает мою жизнь Боюсь, что близость с мамой разрушает мою жизнь

У глубокой привязанности может быть оборотная сторона — созависимость

Psychologies
Не царский сын? Не царский сын?

Рождение Павла Петровича вызвало много пересудов при дворе

Дилетант
Туда и дорога Туда и дорога

Портрет родной страны глазами фотографа и блогера Илии Воскресенского

GQ
«Все будет хорошо»: что не так с этим выражением «Все будет хорошо»: что не так с этим выражением

«Все будет хорошо», — фраза, обесценивающая чужие переживания

Psychologies
Из утенка в принца: удивительные преображения звездных парней Из утенка в принца: удивительные преображения звездных парней

Звездные парни, которые однажды славно потрудились над собой

Cosmopolitan
Константин Хабенский: «Смыслы спектакля не в сказанных героями словах. Они заложены между строк» Константин Хабенский: «Смыслы спектакля не в сказанных героями словах. Они заложены между строк»

Константин Хабенский – о спектакле «Ходжа Насреддин» Театра наций

Grazia
Викрам Паралкар: Ночной театр. Отрывок из романа Викрам Паралкар: Ночной театр. Отрывок из романа

Первая глава романа Викрама Паралкара о рутине сельского хирурга в Индии

СНОБ
Втягивание глаз и стягивание кожи вокруг них помогло рыбам фугу моргнуть Втягивание глаз и стягивание кожи вокруг них помогло рыбам фугу моргнуть

Ранее механизм закрывания глаз у рыб фугу был неизвестен

N+1
Ваня Дмитриенко: «Мне было cтрашно» Ваня Дмитриенко: «Мне было cтрашно»

Ваня Дмитриенко рассказал, кому адресована песня «Венера — Юпитер»

ЖАРА Magazine
Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам

Две трети убитых женщин в 2018 году были жертвами домашнего насилия

Cosmopolitan
Правила жизни Александра Вертинского Правила жизни Александра Вертинского

Поэт и певец, умер 21 мая 1957 года в возрасте 68 лет в Ленинграде

Esquire
Плачь, детка, плачь Плачь, детка, плачь

В чем причина того, что мы плачем часто или не плачем вовсе?

Лиза
«Курганец-25»: главные особенности бронемашины «Курганец-25»: главные особенности бронемашины

Курганец-25 — принципиально новый этап векового развития боевых машин России

Популярная механика
Родила 69 детей, ушла от мужа: кем была самая многодетная россиянка Родила 69 детей, ушла от мужа: кем была самая многодетная россиянка

История россиянки Валентины Васильевой, которая к 40 годам родила 69 детей

Cosmopolitan
Космическая рыбалка: как поймать нейтрино в байкальской воде Космическая рыбалка: как поймать нейтрино в байкальской воде

В Байкале был запущен телескоп, который сможет больше рассказать о космосе

Forbes
Мэй Маск: «Я каждый день работаю над собой. И это очень не просто» Мэй Маск: «Я каждый день работаю над собой. И это очень не просто»

Мэй Маск прекрасно ориентируется в вопросах лишнего веса и правильного питания

Худеем правильно
Джим-тоник Джим-тоник

Многогранность Джима Керри притягивает

Playboy
Новый антибиотик избавил мышей от гонореи Новый антибиотик избавил мышей от гонореи

Описанное соединение имеет шанс перейти к клиническим испытаниям

N+1
Новая мясная диета? Всё, что нужно знать о модном карниворе (и это не кето!) Новая мясная диета? Всё, что нужно знать о модном карниворе (и это не кето!)

Почему биохакеры помешались на животной диете?

Cosmopolitan
Дарья Урсуляк: «Я мама с гиперопекой» Дарья Урсуляк: «Я мама с гиперопекой»

Дарья Урсуляк – о материнстве, съемках и работе

Лиза
Со всем трепетом Со всем трепетом

Рассказываем, как ухаживать за волосами, — чтобы хорошо было и вам, и природе

Glamour
Понятка, или Как выглядит идеология гопников у власти Понятка, или Как выглядит идеология гопников у власти

Гопничество — религия российской власти, понятка — идеологическая модель

СНОБ
Трагедия изумрудного острова Трагедия изумрудного острова

Население Ирландии сократилось почти на треть после голода в середине XIX века

Дилетант
5 шагов к идеальной фигуре: тренер Анджелины Джоли раскрывает секреты 5 шагов к идеальной фигуре: тренер Анджелины Джоли раскрывает секреты

Всего 25 минут в день — и через месяц ты сможешь носить меньший размер одежды!

Cosmopolitan
Журналистки Саша Сулим и Таисия Бекбулатова — о том, как разговаривать с маньяками и рассказывать их истории Журналистки Саша Сулим и Таисия Бекбулатова — о том, как разговаривать с маньяками и рассказывать их истории

Интервью скопинского маньяка Виктора Мохова Ксении Собчак породило дискуссию

Esquire
Открыть в приложении