Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему важно вовремя менять модель управления Почему важно вовремя менять модель управления

Как уметь в нужный момент менять управленческую модель

Forbes
Рене Зеллвегер. В поисках счастья Рене Зеллвегер. В поисках счастья

Хелен Филдинг решила на этот раз не фантазировать, а списать с жизни самой Рене?

Караван историй
«А как же шарики?!» Человечество исчерпает запасы гелия быстрее, чем нефти или газа – но есть выход «А как же шарики?!» Человечество исчерпает запасы гелия быстрее, чем нефти или газа – но есть выход

Поставщики начали отказывать в поставках гелия даже научным лабораториям

ТехИнсайдер
Как перестать повторять одни и те же ошибки: советы психолога Как перестать повторять одни и те же ошибки: советы психолога

Почему мы возвращаемся к старым ошибкам и как выйти из замкнутого круга?

VOICE
Почему телефон долго заряжается: 8 самых популярных причин Почему телефон долго заряжается: 8 самых популярных причин

Все случаи, следствием которых может стать медленная зарядка аккумулятора

CHIP
Как мы не совпадаем Как мы не совпадаем

Почему мы можем не совпадать с потенциальными партнерами?

Psychologies
Почему беспроводные наушники быстро разряжаются Почему беспроводные наушники быстро разряжаются

Причины, по которым беспроводные наушники быстро разряжаются

CHIP
Ярмарка тщеславия Ярмарка тщеславия

В детстве тебе говорили, что хвастать нехорошо, но как же всё-таки правильно?

VOICE
Собаки незаметно наносят ущерб окружающей среде Собаки незаметно наносят ущерб окружающей среде

Ваша собака очаровательна, но она представляет угрозу для окружающей среды

ТехИнсайдер
Искоренить фальсификат Искоренить фальсификат

Методики проверки, испытаний, идентификации продукции нужно совершенствовать

Агроинвестор
Китайское техно Китайское техно

Краткая история технологического идеализма

ТехИнсайдер
Ликвидность на бумаге Ликвидность на бумаге

Почему в банковской системе России сохраняется структурный профицит ликвидности

Ведомости
Делать игры — это профессия: разработчик отвечает на (не)глупые вопросы Делать игры — это профессия: разработчик отвечает на (не)глупые вопросы

Правда, что в России не делают хороших игр? Как стать игровым разработчиком?

ТехИнсайдер
Кто же все-таки виноват Кто же все-таки виноват

«Переходный возраст» — сериал, который только вышел и уже самый обсуждаемый

Weekend
Новый поход ветеранов Троянской войны Новый поход ветеранов Троянской войны

Филистимляне и троянцы против египетских фараонов

Знание – сила
Тонны мусора: как современная экономика заставляет нас увеличивать количество отходов Тонны мусора: как современная экономика заставляет нас увеличивать количество отходов

О том, как гражданское общество в России строит систему сокращения отходов

Forbes
Беззубый театр. Беседа на спорные темы Беззубый театр. Беседа на спорные темы

Продолжение статьи худрука Марка Розовского о современном театре

Знание – сила
Формула любви Александра Абдулова Формула любви Александра Абдулова

«Герой должен умереть молодым» — старая японская пословица. Он жил всего 54 года

Коллекция. Караван историй
Вклад в людей и технологии Вклад в людей и технологии

Москва поддерживает бизнес, выделяя гранты на развитие экспортной деятельности

Ведомости
Хватит играть в GTA: топ-5 крутых игр с открытым миром на ПК Хватит играть в GTA: топ-5 крутых игр с открытым миром на ПК

Каким играм с открытым миром стоит уделить время?

Maxim
Эхо прошедшей войны Эхо прошедшей войны

Это после Великой Отечественной они стали народными актерами, но на фронте...

Коллекция. Караван историй
Арена на двоих Арена на двоих

Как исторически складывались отношения России и США

Эксперт
Что такое биполярное аффективное расстройство и как живут люди с таким диагнозом Что такое биполярное аффективное расстройство и как живут люди с таким диагнозом

Что такое БАР, действительно ли он распространен или стал искусственным трендом?

Forbes
ВЭБ определил стратегию ВЭБ определил стратегию

Группа ВЭБ ориентируется на нацпроекты

Эксперт
Впервые в лаборатории воссоздана нервная цепь человеческой боли Впервые в лаборатории воссоздана нервная цепь человеческой боли

Ученые воспроизвели важный нервный путь, из-за которого человек чувствует боль

ТехИнсайдер
Кто победил бы в битве звезд боевиков 80-х про единоборства Кто победил бы в битве звезд боевиков 80-х про единоборства

Кто самый сильный — Брюс Ли или Джеки Чан? Стивен Сигал или Чак Норрис?

Maxim
Почему галактики закручиваются в спирали: ученые изучили механизмы формирования звездных скоплений Почему галактики закручиваются в спирали: ученые изучили механизмы формирования звездных скоплений

Какие модели образования спиралевидных галактик выделяют учены?

ТехИнсайдер
История 6 соток История 6 соток

Когда появилось такое явление, как дача? Кого можно считать первым дачником?

Лиза
5 полезных устройств для тех, кто затеял ремонт 5 полезных устройств для тех, кто затеял ремонт

Подборка полезной и надежной техники для ремонта

CHIP
Яхонтовый интерес Яхонтовый интерес

История синего сапфира насчитывает в России не одно столетие

Grazia
Открыть в приложении