Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

От Копенгагена до Нормандии: пять мест, где выгодно быть экологичным туристом От Копенгагена до Нормандии: пять мест, где выгодно быть экологичным туристом

Места, где за экологичное поведение туристы могут получить бонус

Forbes
«Картинки» натуралиста «Картинки» натуралиста

Что отражено в русских названиях птиц из семейства куликов?

Наука и жизнь
Как увидеть угрозы безопасности при работе с ИИ? Ловите чек-лист Как увидеть угрозы безопасности при работе с ИИ? Ловите чек-лист

Чем опасны ИИ-модели для бизнеса и почему традиционная ИБ не справляется

Inc.
Снаряды против пушек Снаряды против пушек

Даже в первый год Великой Отечественной войны в СССР проходили соревнования

Ведомости
Мы выбираем друг друга не случайно Мы выбираем друг друга не случайно

Выбор партнера предопределен всем предшествующим ходом нашей жизни

Psychologies
Аналог ацтекского омичикауацтли из человеческой кости выявили среди находок из Техаса Аналог ацтекского омичикауацтли из человеческой кости выявили среди находок из Техаса

Какие ацтекские артефакты обнаружили на юге Техаса

N+1
Победители и побеждённые Победители и побеждённые

Противоречивый мир Англии: норманны властвовали землей, а саксы её возделывали

Дилетант
Проникает ли лак для ногтей в ногтевую пластину: объяснение химика-косметолога Проникает ли лак для ногтей в ногтевую пластину: объяснение химика-косметолога

Действительно ли лаки способны проникнуть в структуру ногтя и нанести ему ущерб?

VOICE
Вечерний спорт влияет на продолжительность сна Вечерний спорт влияет на продолжительность сна

Тренировки перед сном сильнее сказываются на состоянии сна, чем считалось ранее

ТехИнсайдер
Личное пространство Личное пространство

Респектабельный минимализм с авторскими решениями и иконами дизайна

SALON-Interior
Люся Чеботина: «Люблю вызовы и эксперименты» Люся Чеботина: «Люблю вызовы и эксперименты»

Люся Чеботина о весне, вдохновении и любви

Лиза
Настоящие произведения искусства: топ-5 самых красивых паспортов в мире Настоящие произведения искусства: топ-5 самых красивых паспортов в мире

Развороты некоторых паспортов можно смело вывешивать в галереях. Посмотрите!

ТехИнсайдер
Сверхурочная экономика Сверхурочная экономика

Власти и работодатели концептуально договорились об изменении Трудового кодекса

Ведомости
Девелоперы придерживают дома Девелоперы придерживают дома

Почему девелоперы затягивают сроки сдачи многоквартирного жилья

Ведомости
«Книга Страшного суда» «Книга Страшного суда»

«Книга Страшного суда» — итог первой всеобщей переписи земель в Европе

Дилетант
Гадаем по цветам Гадаем по цветам

Тест: какое растение тебе завести, чтобы оно радовало глаз и душу ?

VOICE
Почему герои русской литературы — это антипример концепции wellbeing Почему герои русской литературы — это антипример концепции wellbeing

Не перестаем любить героев великой классики, однако в жизни делаем все наоборот

РБК
Детка, ты просто космос Детка, ты просто космос

Анна Завтур доказывает: не стоит видеть в ней только лирическую героиню

VOICE
«Мы можем подобрать рекламные механики для любого бизнеса» «Мы можем подобрать рекламные механики для любого бизнеса»

Дмитрий Константин о том, как создать эффективную рекламную платформу

Деньги
Рене Зеллвегер. В поисках счастья Рене Зеллвегер. В поисках счастья

Хелен Филдинг решила на этот раз не фантазировать, а списать с жизни самой Рене?

Караван историй
Психологический портрет: что такое дисморфофобия, или синдром Квазимодо Психологический портрет: что такое дисморфофобия, или синдром Квазимодо

Что нужно знать о дисморфофобии?

Forbes
Заемщики поубавили аппетит Заемщики поубавили аппетит

Почему у граждан снижаются запросы на размер кредитов наличными?

Ведомости
Месть и немного любви: пять лучших фильмов этой весны о женщинах Месть и немного любви: пять лучших фильмов этой весны о женщинах

Рассказываем о пяти фильмах про женщин, которые стоит посмотреть

Forbes
Как бизнесу нестыдно реагировать на негативные отзывы, опыт Ozon Travel Как бизнесу нестыдно реагировать на негативные отзывы, опыт Ozon Travel

Как бизнесу общаться с недовольными клиентами

Inc.
«Я везде ищу сценарии» «Я везде ищу сценарии»

Александр Петров о том, как ему работалось над образом почтаря

Weekend
«При загрузке видео на платформу происходит некая магия» «При загрузке видео на платформу происходит некая магия»

Сергей Косинский об искусственном интеллекте и будущем медиа

Деньги
Книга на выходные: как ChatGPT стал самым эффективным копирайтером «Зерокодера» Книга на выходные: как ChatGPT стал самым эффективным копирайтером «Зерокодера»

Отрывок из книги «Искусственный интеллект: путь к новому миру»

Inc.
Исследование показало, что подростки, которые рано ложатся спать, обладают более острым мозгом Исследование показало, что подростки, которые рано ложатся спать, обладают более острым мозгом

Подростки, которые ложатся спать раньше, как правило, обладают более острым умом

Inc.
Корней Чуковский Корней Чуковский

Корней Чуковский — литературный гений, полный противоречий

Дилетант
Я вас люблю Я вас люблю

Стоит ли признаваться в любви первой?

Лиза
Открыть в приложении