Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

В чем суть открытия

Рекомендуемые статьи

Места, где за экологичное поведение туристы могут получить бонус

Что отражено в русских названиях птиц из семейства куликов?

Чем опасны ИИ-модели для бизнеса и почему традиционная ИБ не справляется

Даже в первый год Великой Отечественной войны в СССР проходили соревнования

Выбор партнера предопределен всем предшествующим ходом нашей жизни

Какие ацтекские артефакты обнаружили на юге Техаса

Противоречивый мир Англии: норманны властвовали землей, а саксы её возделывали

Действительно ли лаки способны проникнуть в структуру ногтя и нанести ему ущерб?

Тренировки перед сном сильнее сказываются на состоянии сна, чем считалось ранее

Респектабельный минимализм с авторскими решениями и иконами дизайна

Люся Чеботина о весне, вдохновении и любви

Развороты некоторых паспортов можно смело вывешивать в галереях. Посмотрите!

Власти и работодатели концептуально договорились об изменении Трудового кодекса

Почему девелоперы затягивают сроки сдачи многоквартирного жилья

«Книга Страшного суда» — итог первой всеобщей переписи земель в Европе

Тест: какое растение тебе завести, чтобы оно радовало глаз и душу ?

Не перестаем любить героев великой классики, однако в жизни делаем все наоборот

Анна Завтур доказывает: не стоит видеть в ней только лирическую героиню

Дмитрий Константин о том, как создать эффективную рекламную платформу

Хелен Филдинг решила на этот раз не фантазировать, а списать с жизни самой Рене?

Что нужно знать о дисморфофобии?

Почему у граждан снижаются запросы на размер кредитов наличными?

Рассказываем о пяти фильмах про женщин, которые стоит посмотреть

Как бизнесу общаться с недовольными клиентами

Александр Петров о том, как ему работалось над образом почтаря

Сергей Косинский об искусственном интеллекте и будущем медиа

Отрывок из книги «Искусственный интеллект: путь к новому миру»

Подростки, которые ложатся спать раньше, как правило, обладают более острым умом

Корней Чуковский — литературный гений, полный противоречий

Стоит ли признаваться в любви первой?