Почему извлечь пользу из big data получается не у всех?

РБКБизнес

Принять как данные

Автор: Оксана Гончарова

0:00 /
1029.799
Фото: ТАСС

Евгений и Татьяна вернут кредит с большей вероятностью, чем Ипполит и Барбара. Выйдя из отпуска, рабочие вдвое чаще подвергают себя риску производственной травмы… Анализируя большие данные, компании учатся выявлять подобные скрытые закономерности, улучшая свои бизнес-показатели. Направление модное, но извлечь пользу из big data получается не у всех. Причина — отсутствие в компаниях культуры работы с ними.

«Чем более распространенное имя у человека, тем выше шанс, что он заплатит вовремя. Чем больше этажей в твоем доме, тем статистически ты более хороший заемщик. Знак зодиака почти не влияет на вероятность возврата денег, а вот психотип — значительно», — рассказывает о неожиданных закономерностях в поведении заемщиков аналитик Банка Хоум Кредит Станислав Дужинский. Объяснить многие из этих закономерностей он не берется — их выявил искусственный интеллект, обработавший тысячи профилей клиентов.

В этом сила аналитики big data: проанализировав огромный объем неструктурированных данных, программа может обнаружить множество корреляций, о которых самый мудрый аналитик-человек даже не догадывается. У любой компании есть огромное количество неструктурированных данных (big data) — о сотрудниках, клиентах, партнерах, конкурентах, которые можно использовать с пользой для бизнеса: улучшить эффект от рекламных акций, добиться роста продаж, снизить кадровую текучку и т.п.

Первыми работать с big data начали крупные технологические и телекоммуникационные компании, финансовые организации и ретейл, комментирует Рафаил Мифтахов, директор группы технологической интеграции «Делойт», СНГ. Сейчас интерес к таким решениям есть во многих отраслях. Чего удалось добиться компаниям? И всегда ли анализ больших данных позволяет делать ценные выводы?

Нелегкий груз

Банки используют алгоритмы обработки больших данных прежде всего для улучшения качества обслуживания клиентов и оптимизации затрат, а также для управления рисками и борьбы с мошенничеством. «За последние годы в сфере анализа big data произошла настоящая революция, — говорит Дужинский. — Применение машинного обучения позволяет нам намного более точно прогнозировать вероятность невозврата кредита — просрочки в нашем банке составляют всего 3,9%». Для сравнения, на 1 января 2019 года доля ссуд с просроченными платежами свыше 90 дней по кредитам, выдаваемым физлицам, составила, по данным ЦБ, 5%.

Изучением больших данных озадачились даже микрофинансовые организации. «Предоставлять финансовые услуги без анализа больших данных сегодня все равно, что заниматься математикой без цифр, — рассуждает Андрей Пономарев, гендиректор платформы интернет-кредитования Webbankir. — Мы выдаем деньги онлайн, не видя ни самого клиента, ни его паспорта, и в отличие от традиционного кредитования должны не только оценить платежеспособность человека, но и идентифицировать его личность».

Сейчас в базе компании хранится информация по более чем 500 тыс. клиентов. Каждая новая заявка анализируется с учетом этих данных примерно по 800 параметрам. Программа учитывает не только пол, возраст, семейное положение и кредитную историю, но и то, с какого устройства человек заходил на платформу, как вел себя на сайте. Насторожить, например, может то, что потенциальный заемщик не воспользовался кредитным калькулятором или не поинтересовался условиями выдачи займа. «За исключением нескольких стоп-факторов — скажем, мы не выдаем займы лицам моложе 19 лет — ни один из перечисленных параметров сам по себе не является поводом для отказа или согласия в выдаче займа», — поясняет Пономарев. Важна именно совокупность факторов. В 95% случаев решение принимается автоматически, без участия специалистов отдела андеррайтинга.

Анализ big data позволяет выводить интересные закономерности, делится Пономарев. Например, пользователи iPhone оказались более дисциплинированными заемщиками, чем владельцы устройств на базе Android — первые получают одобрение заявок в 1,7 раза чаще. «То, что военнослужащие не возвращают кредиты почти на четверть реже, чем средний заемщик, не было неожиданностью, — говорит Пономарев. — А вот от студентов обязательности обычно не ожидают, а между тем случаи кредитных дефолтов у них встречаются на 10% реже, чем в среднем по базе».

Изучение больших данных позволяет проводить скоринг и для страховщиков. Работающая с 2016 года компания IDX занимается удаленной идентификацией личности и онлайн-проверкой документов. Эти услуги востребованы среди страховщиков грузоперевозок, которые заинтересованы, чтобы грузы пропадали как можно реже. Прежде чем застраховать перевозку товара, страховщик с согласия водителя проверяет его на благонадежность, поясняет Ян Слока, коммерческий директор IDX. Вместе с партнером — петербургской компанией «Контроль рисков» — IDX разработала сервис, который позволяет проверить личность водителя, паспортные данные и права, участие в инцидентах, связанных с утратой груза, и т.п. Проведя анализ базы водителей, компания выявила «группу риска»: чаще всего грузы пропадают у водителей 30–40 лет с большим водительским стажем, часто менявших в последнее время работу. Выяснилось также, что груз чаще всего воруют водители автомобилей, срок эксплуатации которых превышает восемь лет.

В поиске

У ретейлеров задача иная — вычислить клиентов, готовых совершить покупку, и определить наиболее эффективные способы привести их на сайт или в магазин. С этой целью программы анализируют профиль клиентов, данные из их личного кабинета, историю покупок, поисковых запросов и использования бонусных баллов, содержимое электронных корзин, которые они было начали заполнять, да бросили. Аналитика данных позволяет сегментировать всю базу и выделять группы потенциальных покупателей, которым может оказаться интересным то или иное предложение, говорит Кирилл Иванов, директор data-офиса группы «М.Видео-Эльдорадо».

Например, программа выделяет группы клиентов, каждой из которых нравятся разные маркетинговые инструменты — беспроцентный кредит, кешбэк или скидочный промокод. Эти покупатели получают email-рассылку с соответствующей акцией. Вероятность того, что человек, открыв письмо, перейдет на сайт компании, в этом случае значительно увеличивается, отмечает Иванов.

Анализ данных позволяет также повышать продажи сопутствующих товаров и аксессуаров. Система, обработавшая историю заказов других клиентов, выдает покупателю рекомендации, что можно купить вместе с выбранным товаром. Тестирование такого метода работы, по словам Иванова, показало увеличение количества заказов с аксессуарами на 12% и рост оборота аксессуаров на 15%.

Улучшить качество сервиса и повысить продажи стремятся не только ретейлеры. Летом прошлого года «МегаФон» запустил «умный» сервис предложений, в основу которого легла обработка данных миллионов абонентов. Изучив их поведение, искусственный интеллект научился формировать внутри тарифов персональные предложения для каждого клиента. Например, если программа отмечает, что человек активно смотрит на своем устройстве видео, сервис предложит ему расширить объем мобильного трафика. Учитывая предпочтения пользователей, компания предоставляет абонентам безлимитный трафик на их любимые виды интернет-досуга — например, на использование мессенджеров или прослушивание музыки в стриминговых сервисах, на общение в соцсетях или просмотр сериалов.

«Мы анализируем поведение абонентов и понимаем, как меняются их интересы, — объясняет Виталий Щербаков, директор по аналитике больших данных «МегаФона». — Например, в этом году трафик AliExpress вырос в 1,5 раза по сравнению с прошлым годом, и в целом количество заходов на сайты интернет-магазинов одежды растет: в 1,2–2 раза в зависимости от конкретного ресурса».

Другой пример работы оператора с большими данными — платформа для поиска пропавших детей и взрослых «МегаФон Поиск». Система анализирует, какие люди могли находиться рядом с местом пропажи человека, и рассылает им информацию с фотографией и приметами пропавшего. Оператор разрабатывал и тестировал систему совместно с МВД и организацией «Лиза Алерт»: в течение двух минут ориентировки на пропавшего получают более 2 тыс. абонентов, что значительно увеличивает шансы на удачный результат поиска.

Не ходите в ПАБ

Анализ больших данных нашел применение и в промышленности. Здесь он позволяет прогнозировать спрос и планировать продажи. Так, в группе компаний «Черкизово» три года назад внедрили решение на базе SAP BW, которое позволяет хранить и обрабатывать всю информацию по продажам: цены, ассортимент, объемы продукции, акции, каналы сбыта, рассказывает Владислав Беляев, директор по информационным технологиям группы «Черкизово». Анализ накопленных 2 Тб информации не только дал возможность эффективно формировать ассортимент и оптимизировать продуктовый портфель, но и облегчил работу сотрудникам. Например, для подготовки ежедневного отчета по продажам потребовался бы день работы множества аналитиков — по два на каждый продуктовый сегмент. Сейчас этот отчет готовит робот, тратя на все сегменты всего 30 минут.

«В промышленности большие данные эффективно работают в связке с интернетом вещей, — утверждает генеральный директор компании Umbrella IT Станислав Мешков. — На основе анализа данных с датчиков, которыми оснащено оборудование, можно выявлять отклонения в его работе и предотвращать поломки, спрогнозировать производительность».

В «Северстали» с помощью big data пытаются решать и довольно нетривиальные задачи — например, снизить показатели травматизма. В 2019 году на мероприятия по улучшению безопасности труда компания выделила около 1,1 млрд руб. В «Северстали» рассчитывают к 2025 году снизить уровень травматизма на 50% (по сравнению с 2017 годом). «Если линейный руководитель — мастер, начальник участка, начальник цеха — заметил, что работник выполняет те или иные операции небезопасно (не держится за поручни при подъеме по лестнице на промплощадке или не носит все средства индивидуальной защиты), он выписывает ему особое замечание — ПАБ (от «поведенческий аудит безопасности»)», — рассказывает Борис Воскресенский, начальник отдела анализа данных компании.

Проведя анализ данных о количестве ПАБов в одном из подразделений, специалисты компании выявили, что правила техники безопасности чаще всего нарушались теми, кто уже имел несколько замечаний раньше, а также теми, кто незадолго до инцидента находился на больничном или в отпуске. Нарушения в первую неделю после выхода из отпуска или с больничного оказались вдвое выше, чем в последующее время: 1 против 0,55%. А вот работа в ночную смену, как выяснилось, не влияет на статистику ПАБов.

В отрыве от реальности

Создать алгоритмы обработки больших данных — не самая трудная часть работы, отмечают представители компаний. Гораздо сложнее понять, как эти технологии можно применить в контексте каждого конкретного бизнеса. Именно здесь кроется ахиллесова пята аналитиков компаний и даже внешних провайдеров, которые, казалось бы, имеют наработанную экспертизу в области big data.

«Я часто встречал специалистов по анализу больших данных, которые были прекрасными математиками, но не обладали необходимым пониманием бизнес-процессов», — рассказывает Cергей Котик, директор по развитию компании GoodsForecast. Он вспоминает, как два года назад его компании довелось участвовать в конкурсе по прогнозированию спроса для одной федеральной розничной сети. Был выбран пилотный регион, по всем товарам и магазинам которого участники строили прогнозы. Затем прогнозы сравнивались с фактическими продажами. Первое место занял один из российских интернет-гигантов, известный своей экспертизой в машинном обучении и анализе данных: в своих прогнозах он показал минимальное отклонение от фактических продаж.

Но когда сеть стала изучать его прогнозы детальнее, выяснилось, что с точки зрения бизнеса они абсолютно неприемлемы. Компания представила модель, которая выдавала планы продаж с систематическим занижением. Программа поняла, как минимизировать вероятность ошибки в прогнозах: безопаснее занижать продажи, поскольку максимальная ошибка может составить 100% (отрицательных продаж не бывает), а вот в сторону перепрогноза она может быть сколь угодно большой, поясняет Котик. Другими словами, компания представила идеальную математическую модель, которая в реальных условиях привела бы к полупустым магазинам и огромным убыткам от недопродаж. В результате в конкурсе победила другая компания, чьи расчеты можно было применить на практике.

«Авось» вместо big data

Технологии больших данных актуальны для многих отраслей, но активное их внедрение происходит не везде, замечает Мешков. Например, в здравоохранении есть проблема с хранением данных: информации накоплено много и она регулярно обновляется, но по большей части эти данные еще не оцифрованы. Есть также много данных в госструктурах, но они не объединены в общий кластер. Разработка единой информационной платформы Национальной системы управления данными (НСУД) как раз направлена на то, чтобы решить эту задачу, говорит эксперт.

Впрочем, Россия — далеко не единственная страна, где в большинстве организаций важные решения принимаются на основе интуиции, а не анализа больших данных. В апреле прошлого года компания «Делойт» провела опрос среди более чем тысячи руководителей крупных американских компаний (со штатом от 500 человек) и выяснила, что 63% опрошенных знакомы с технологиями big data, но не имеют всей необходимой инфраструктуры, чтобы их применять. Между тем среди 37% компаний с высоким уровнем аналитической зрелости почти половина значительно превысили бизнес-цели за последние 12 месяцев.

Исследование выявило, что помимо сложности внедрения новых технических решений важной проблемой в компаниях является отсутствие культуры работы с данными. Не стоит ждать хороших результатов, если ответственность за решения, принятые на основе big data, будет возлагаться только на аналитиков компании, а не на всю компанию в целом. «Сейчас компании ищут интересные сценарии использования больших данных, — говорит Мифтахов. — При этом внедрение некоторых сценариев требует инвестиций в системы сбора, обработки и контроля качества дополнительных данных, которые ранее не анализировались». Увы, «аналитика — пока еще не командный вид спорта», — признают авторы исследования.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Алексей Осадчий: «Один из самых сложных вызовов — интерпретация активности мозга» Алексей Осадчий: «Один из самых сложных вызовов — интерпретация активности мозга»

Как работают интерфейсы «мозг — компьютер», сможем ли мы лечить деменцию?

РБК
7 факторов, которые влияют на твою сперму (и не у всех положительный эффект!) 7 факторов, которые влияют на твою сперму (и не у всех положительный эффект!)

Информация о сперме, которой должен владеть каждый

Playboy
Ткать узор дальше Ткать узор дальше

Почему последствия ссоры с Россией окажутся болезненными для Азербайджана?

Монокль
Серый кардинал YouTube: кто помогает Дудю, Саше Спилберг и Ивангаю зарабатывать миллионы Серый кардинал YouTube: кто помогает Дудю, Саше Спилберг и Ивангаю зарабатывать миллионы

Блог о косметике вырос в крупнейшую в России медиасеть Yoola

Forbes
С Ордой и молитвой С Ордой и молитвой

Православная церковь установила с Ордой собственные, довольно прочные отношения

Дилетант
История француженки, которая приехала на велосипеде в тайгу и стала женой охотника-удэгейца История француженки, которая приехала на велосипеде в тайгу и стала женой охотника-удэгейца

Как француженка вышла замуж за удэгейца, родила двух детей и построила дом

СНОБ
Как перестать соблюдать дурацкие правила на работе и в жизни Как перестать соблюдать дурацкие правила на работе и в жизни

Писательница Сара Найт бросила успешную карьеру ради фриланса

Forbes
Долгая счастливая жизнь Долгая счастливая жизнь

Самой желанной целью прогресса всегда была и остается вечная жизнь

GQ
(Не)мужское это дело! (Не)мужское это дело!

Быть ли в жизни мужчин тональному крему, цветным прядям и салонным процедурам?

Grazia
Кому я сказала? Кому я сказала?

Писатель Ника Набокова разбирается, как найти общий язык с сильным полом

Cosmopolitan
#инструктаж: как замедлить процесс старения на клеточном уровне #инструктаж: как замедлить процесс старения на клеточном уровне

Что такое митохондрии и как они влияют на процессы старения

РБК
Ты стал другим Ты стал другим

У современных мужчин катастрофически падает уровень тестостерона

Tatler
В рейтинг богатейших женщин России впервые вошли два миллиардера В рейтинг богатейших женщин России впервые вошли два миллиардера

Богатейшие женщины России

Forbes
Вышедший в космос ушел навсегда: за что мы ценим Алексея Леонова Вышедший в космос ушел навсегда: за что мы ценим Алексея Леонова

Дважды герой Советского Союза Леонов первым вышел в открытый космос

Популярная механика
Между Европой и Россией: Калининград в 12 кадрах Дмитрия Маркова, снятых на iPhone 11 Pro Между Европой и Россией: Калининград в 12 кадрах Дмитрия Маркова, снятых на iPhone 11 Pro

Как снимает iPhone 11 Pro: показывает известный фотограф Дмитрий Марков

Esquire
«Стоял пять часов». Водители жалуются на долгое ожидание ГИБДД «Стоял пять часов». Водители жалуются на долгое ожидание ГИБДД

Водители чаще жалуются на многочасовые ожидания ГИБДД для оформления аварий

РБК
Почему Канье Уэст не выпустил новый альбом Почему Канье Уэст не выпустил новый альбом

Esquire анализирует творческий путь рэпера последних лет

Esquire
Погоня, деньги, PIN-коды: три мнения о Lexus UX Погоня, деньги, PIN-коды: три мнения о Lexus UX

Самый маленький кроссовер в истории Lexus

РБК
Как новая налоговая уловка превращает управляющих инвестфирм в миллиардеров Как новая налоговая уловка превращает управляющих инвестфирм в миллиардеров

Льготы, которые помогают легально уходить от налогов и становиться миллиардерами

Forbes
«Шальная императрица»: каким получился мини-сериал «Екатерина Великая» с Хелен Миррен (спойлер: пикантным) «Шальная императрица»: каким получился мини-сериал «Екатерина Великая» с Хелен Миррен (спойлер: пикантным)

В онлайн-сервисе Amediateka появились все серии мини-сериала «Екатерина Великая»

Esquire
Среди равных. Как бизнес в России решает гендерную проблему Среди равных. Как бизнес в России решает гендерную проблему

В России возможности женщины и мужчины не равны

Forbes
Без потерь Без потерь

Почему волосы начинают усиленно выпадать и как с этим бороться

Лиза
Найти свое место в новой реальности, или Кто кого возьмет на работу? Найти свое место в новой реальности, или Кто кого возьмет на работу?

Как нам найти новое место под солнцем в настоящем и будущем?

Psychologies
20 главных изобретений ИТМО: От нового языка программирования до наномашин против рака. 20 главных изобретений ИТМО: От нового языка программирования до наномашин против рака.

Университет ИТМО не зря включен в Топ-100 рейтинга «Компьютерные технологии»

Собака.ru
«Мы думали, это весна». Стоит ли надеяться на либерализацию режима «Мы думали, это весна». Стоит ли надеяться на либерализацию режима

Хотя протесты стали достоянием истории, обсуждение их последствий продолжается

СНОБ
Обзор миникомпьютера Intel NUC7I5DNHE: великое в малом Обзор миникомпьютера Intel NUC7I5DNHE: великое в малом

Формат мини-ПК продолжает оставаться популярным для решения офисных задач

CHIP
Таблетка с чипом Таблетка с чипом

С января будущего года в нашей стране вводится обязательная маркировка лекарств

Лиза
Как жить с псориазом? История финалистки «Мисс Вселенная» Как жить с псориазом? История финалистки «Мисс Вселенная»

Ксения Шипилова, финалистка конкурса «Мисс Вселенная» поделилась своей историей

Cosmopolitan
Как пандемия «свиной чумы» распространяется по планете: апокалипсис свиней Как пандемия «свиной чумы» распространяется по планете: апокалипсис свиней

В сентябре китайские власти распродали с аукциона 10 тысяч тонн свинины

Популярная механика
«Мы живем вином»: как Simple изменили винную культуру в России «Мы живем вином»: как Simple изменили винную культуру в России

Что изменилось за 25 лет на винном рынке и в компании Simple

Forbes
Открыть в приложении