Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Это начало последней главы» «Это начало последней главы»

Что писали о первой встрече Джо Байдена и Владимира Путина зарубежные СМИ

РБК
Предки, держитесь! Предки, держитесь!

С твоим ребенком творится что-то неладное?

Лиза
Воссозданные частицы дымки Титана помогут понять, как зародилась жизнь на Земле Воссозданные частицы дымки Титана помогут понять, как зародилась жизнь на Земле

Изучение атмосферы Титана может дать важные ключи к разгадке стадий эволюции

Популярная механика
5 причин пересмотреть «50 оттенков серого» 5 причин пересмотреть «50 оттенков серого»

Пора вновь заглянуть в тайную комнату мистера Грея!

Cosmopolitan
Под колпаком: как нами управляют приложения для знакомств и родительского контроля Под колпаком: как нами управляют приложения для знакомств и родительского контроля

Не все полезные приложения безвредны

Forbes
Физики МФТИ приблизили создание квантового компьютера в России Физики МФТИ приблизили создание квантового компьютера в России

Создана квантовая интегральная схема на основе пяти сверхпроводниковых кубитов

Популярная механика
Квантовую динамику холодных атомов научились измерять недеструктивно Квантовую динамику холодных атомов научились измерять недеструктивно

Как атомы влияют на распространение микроволнового излучения

N+1
«Война за орбиту»: как СССР и США готовились к космической третьей мировой войне «Война за орбиту»: как СССР и США готовились к космической третьей мировой войне

Решающим сражением в третьей мировой станет битва за орбиту

Maxim
Феноменальные преображения: как выглядели советские актрисы до и после пластики Феноменальные преображения: как выглядели советские актрисы до и после пластики

Красавицы советского кино, менявшие внешность с помощью пластической хирургии

Cosmopolitan
Российские химики создали новый тип аккумулятора, который заряжается в 10 раз быстрее литий-ионного Российские химики создали новый тип аккумулятора, который заряжается в 10 раз быстрее литий-ионного

Ученые создали более безопасные и быстро заряжающиеся аккумуляторы

Популярная механика
Семейная терапия Семейная терапия

Одинокий подросток: опасности и поддержка

СНОБ
Редкий кадр: 7 женщин-режиссеров в истории «Оскара» Редкий кадр: 7 женщин-режиссеров в истории «Оскара»

За историю «Оскара» на статуэтку претендовали всего семь женщин-режиссеров

Forbes
10 самых уродливых животных, находящихся на грани вымирания 10 самых уродливых животных, находящихся на грани вымирания

Эти странные животные находятся на грани вымирания и ждут помощи от человека

Популярная механика
Со знанием дела Со знанием дела

Действенные способы строить карьеру осознанно

Cosmopolitan
Наночастицы против рака: прорыв в онкологии Наночастицы против рака: прорыв в онкологии

Как онкологи синтезируют наночастицы, которые позволяют удалять опухоль

Популярная механика
История одной песни: «One Way Ticket» История одной песни: «One Way Ticket»

Запутанная история песни «One Way Ticket»

Maxim
«Проблемы с эмпатией». Возможна ли российская оппозиция без Навального «Проблемы с эмпатией». Возможна ли российская оппозиция без Навального

Получится ли у оставшихся лидеров ФБК* справится с ролью публичных политиков

СНОБ
Ваня Дмитриенко: «Мне было cтрашно» Ваня Дмитриенко: «Мне было cтрашно»

Ваня Дмитриенко рассказал, кому адресована песня «Венера — Юпитер»

ЖАРА Magazine
Советские лайфхаки и советы, полезные по сей день Советские лайфхаки и советы, полезные по сей день

Страна советов: как вешать ковер, расставлять мебель и обустраивать берлогу

Maxim
Popovy sisters Popovy sisters

Эльфы-близнецы Екатерина и Елена Поповы делают невероятных кукол

Собака.ru
3D-моделирование помогло прочитать древнерусские надписи на стенах собора 3D-моделирование помогло прочитать древнерусские надписи на стенах собора

Ученые смогли восстановить текст древнейшего памятника письменности

Популярная механика
«Я никому не нужен»: отчего возникает такая мысль и советы психолога, как от нее избавиться «Я никому не нужен»: отчего возникает такая мысль и советы психолога, как от нее избавиться

Как преодолеть ощущение собственной ненужности и негативное мышление

Playboy
Строим трансформатор Теслы на дому Строим трансформатор Теслы на дому

Резонансный трансформатор, известный также как «катушка Теслы»

Популярная механика
Как перестать бояться и полюбить визиты к урологу Как перестать бояться и полюбить визиты к урологу

Объясняем, как не бояться визита в кабинет уролога и следить за своим здоровьем

Maxim
Эротика со слезами: знаменитые кинопары, которые в жизни ненавидели друг друга Эротика со слезами: знаменитые кинопары, которые в жизни ненавидели друг друга

Съемки в откровенных сценах не всегда заканчиваются для актеров бурными романами

Cosmopolitan
125 лет психоанализу: Как Зигмунд Фрейд изменил психотерапию 125 лет психоанализу: Как Зигмунд Фрейд изменил психотерапию

Главные открытия Фрейда, навсегда изменившие психологию

Популярная механика
История балетного костюма История балетного костюма

Как эволюционировал балетный костюм в России

Культура.РФ
История любви: зачем Россия возвращается на Венеру История любви: зачем Россия возвращается на Венеру

Этот проект может стать самой сложной межпланетной миссией за всю историю

Forbes
Если у близкого человека психоз: что нужно знать родным и друзьям Если у близкого человека психоз: что нужно знать родным и друзьям

Как поддержать близкого, страдающего от психозов?

Psychologies
Моя красотка! Как выглядят мамы Риз Уизерспун, Шэрон Стоун и других звезд кино Моя красотка! Как выглядят мамы Риз Уизерспун, Шэрон Стоун и других звезд кино

Посмотрим на родственниц Мелани Гриффит, Шэрон Стоун и других знаменитостей

Cosmopolitan
Открыть в приложении