Свяжитесь с моим агентом

Артур Самигуллин, руководитель Yandex AI Studio, об ИИ-агентах: кто будет их создавать, как ими будут пользоваться и не приведут ли они к деградации человека разумного

Интервью: Чермен Дзгоев

Давайте начнем с базы, потому что понятие агента для большинства людей пока довольно размыто. Что вы под словом «агент» понимаете?

Если по-простому, агент — это система, которая может не просто сгенерировать ответ, а самостоятельно решить задачу. Для этого агент может понять цель, выбрать инструменты, спланировать действия и проверить себя по ходу решения.

То есть агент нужен в сложных многосоставных задачах?

Да, именно. Индустрия любит всё упрощать, но граница здесь довольно понятная. Если речь о чем-то вроде перевода денег маме, то нам не нужен агент, гораздо удобнее нажать на две кнопки. А вот там, где возникает сложный сценарий с множеством шагов, агент уже уместен.

Хороший пример — планирование путешествия. Ты не просто выбираешь билет из Москвы в Петербург. Ты думаешь: хочу зимой улететь из Москвы туда, где есть море, но рядом должен быть город, чтобы не только на пляже лежать. Дальше начинается поиск вариантов, подбор дат по цене, поиск отеля по набору критериев, попытка уложить всё это в бюджет. Ты можешь посмотреть Таиланд, понять, что он не подходит, и вернуться к ОАЭ. Вот в таких задачах, где есть рассуждение, возвраты, много критериев и много действий, агенты действительно будут полезны.

Что агенты уже сейчас умеют делать хорошо?

Я бы разделил агентов на два типа — кстати, применительно к обычным сотрудникам логика этого разделения тоже работает. Первый — workflow-агенты. Это, по сути, агенты внутри заданного процесса. У них понятный алгоритм, понятные правила, от которых нельзя отклоняться. Они сегодня уже активно используются в бизнесе.

Как секретарь.

Именно. Второй тип — более автономные агенты. Это уже ближе к тому, как работает, например, живой разработчик. Ты задаешь ему цель, даешь контекст и ограничения, а дальше он сам, используя знания, инструменты, данные компании и интернета, пытается прийти к результату. Он не прошит жестким сценарием. Но если говорить честно, сегодня агенты живут в довольно узких и хорошо обвязанных сценариях: разобрать входящие сообщения, подготовить черновики писем, суммаризировать встречи, поискать по корпоративным знаниям, маршрутизировать тикеты, заполнить CRM по итогам разговора. Там, где есть четкий процесс и цена ошибки не катастрофическая, они уже очень полезны. По сути, прямо сейчас агенты хороши как операционный слой рядом с человеком. А вот как самостоятельных менеджеров «без поводка» рынок их, мне кажется, пока сильно переоценил.

В будущем их все-таки отпустят с поводка?

Там, где есть понятный, формализованный способ оценить качество результата, работа очень сильно автоматизируется. Человек останется в контуре, но уйдет от ручной операционки. Будет формулировать задачу, а в конце принимать результат.

В Yandex AI Studio есть конструктор агентов. Он на кого рассчитан? Может ли простой человек без специальных знаний собрать себе на коленке помощника?

Платформа в первую очередь рассчитана на тех, кто понимает логику софта. На айтишников. Причем айтишник — не обязательно программист, агентов на платформе можно со здавать без навыков кодинга. Но человек должен уметь мыслить такими сущностями, как «источник данных», «триггер», «роли доступа», «ошибка» и так далее. Продвинутые пользователи уже к нам заходят, особенно в сценариях вроде «собери мне ассистента, который анализирует данные», «разбери почту», «ответь на сообщения в мессенджере в таком-то виде», «заполни CRM по итогам звонка». Но это пока точно не массовый потребительский продукт в духе «нажал кнопку — получил сотрудника».

Но вы к этому стремитесь?

К упрощению стремимся, но до известных пределов. Я не верю, что массовая аудитория придет в конструкторы. Массовой аудитории нужны готовые помощники, зашитые в привычные продукты, — например, мы встраиваем так Алису Про в сервисы «Яндекс 360». Если ваша рабочая жизнь проходит в таблицах, значит, логично, чтобы помощник жил прямо в таблице, а не в отдельном приложении. Можно, конечно, загрузить Excel-файл в ChatGPT и попросить его проанализировать, но гораздо естественнее, когда заходишь в сам Excel или Google Sheets и работаешь там. В интерфейс Google Sheets нейросеть Gemini уже встроена. Буквально это я и имею в виду. Поэтому Google постепенно отжимает долю у OpenAI — у них больше привычных точек входа.