Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Признание и обвинение: почему общество не верит рассказам женщин о пережитом насилии Признание и обвинение: почему общество не верит рассказам женщин о пережитом насилии

Как общество относится к рассказам женщин о травматичном опыте?

Forbes
Найденная рыбаками на дне Тайваньского пролива древняя челюсть принадлежала денисовцу Найденная рыбаками на дне Тайваньского пролива древняя челюсть принадлежала денисовцу

Кусок нижней челюсти архаичного человека Penghu-1 принадлежал денисовцу

N+1
Только не перезванивайте: 5 простых способов, как узнать, кто звонил с неизвестного номера Только не перезванивайте: 5 простых способов, как узнать, кто звонил с неизвестного номера

Как понять, что с незнакомого номера звонит злоумышленник?

ТехИнсайдер
Ловушки для трендов: как вовремя услышать сигналы рынка Ловушки для трендов: как вовремя услышать сигналы рынка

Как бизнесменам научиться самим улавливать тренд-сигналы

Forbes
Эмоциональный интеллект Эмоциональный интеллект

Новое представление о том, что значит быть «умным»

kiozk originals
Реклама для женщин: как фемвертайзинг ломает стереотипы и увеличивает прибыль брендов Реклама для женщин: как фемвертайзинг ломает стереотипы и увеличивает прибыль брендов

Почему фемвертайзинг становится трендом

Forbes
Конкуренты Конкуренты

Какими они были, конкуренты герцога Нормандского?

Дилетант
Дорогой льдов: что такое Северный морской путь и зачем Россия его развивает Дорогой льдов: что такое Северный морской путь и зачем Россия его развивает

Какую роль Севморпуть играет в экономике России и какие перспективы его ждут

ФедералПресс
Почему взрослые дети не уважают зрелых родителей: мнение и советы психоаналитика Почему взрослые дети не уважают зрелых родителей: мнение и советы психоаналитика

Почему мы считаем родительские убеждения устаревшими и обесцениваем их опыт

Psychologies
Ценный попутчик Ценный попутчик

Как путешествовать с собакой без стресса

Лиза
Собаки незаметно наносят ущерб окружающей среде Собаки незаметно наносят ущерб окружающей среде

Ваша собака очаровательна, но она представляет угрозу для окружающей среды

ТехИнсайдер
Дачники идут! Дачники идут!

Составили психологических портрет тех, кто предпочитает курортам свои фазенды

Лиза
Девелоперы придерживают дома Девелоперы придерживают дома

Почему девелоперы затягивают сроки сдачи многоквартирного жилья

Ведомости
Падая в пропасть Падая в пропасть

Страхи мешают жить? Познакомьтесь с ними и попытайтесь приручить

Psychologies
ВЭБ определил стратегию ВЭБ определил стратегию

Группа ВЭБ ориентируется на нацпроекты

Эксперт
Как тебя зовут? Как тебя зовут?

Что такое число имени и как оно влияет на судьбу

Лиза
Перовскитные солнечные элементы как перспективное направление зеленой энергетики Перовскитные солнечные элементы как перспективное направление зеленой энергетики

Как перовскитные солнечные элементы сделают энергетическую систему экологичнее?

Наука и техника
Эпидемия цифрового слабоумия: почему нынешние поколения глупее предыдущих Эпидемия цифрового слабоумия: почему нынешние поколения глупее предыдущих

Почему из-за развития цифровых технологий снижаются когнитивные функции человека

Монокль
Гости из настоящего и будущего Гости из настоящего и будущего

Столичная туриндустрия укрепляет свои позиции как драйвера развития Москвы

Ведомости
Что вас бесит больше всего: психологический тест с выбором картинки Что вас бесит больше всего: психологический тест с выбором картинки

Пройдите тест и узнайте, от чего может исходить ваша агрессия!

ТехИнсайдер
Сверхурочная экономика Сверхурочная экономика

Власти и работодатели концептуально договорились об изменении Трудового кодекса

Ведомости
Открывая космос Открывая космос

Путеводитель женщины-астронавта по миру миссий, чудес и перемен в космосе

kiozk originals
«Отсутствие масштабных идей сдерживает приток инвестиций» «Отсутствие масштабных идей сдерживает приток инвестиций»

На чьи деньги стоит рассчитывать российским стартапам

Эксперт
Меркантилизм, абсолютизм и танатология глобализации Меркантилизм, абсолютизм и танатология глобализации

Трамп открыл чемпионат мира по торговым тарифам

Деньги
Какую одежду с этикеткой «стирка запрещена» можно стирать дома: мнение экспертов Какую одежду с этикеткой «стирка запрещена» можно стирать дома: мнение экспертов

Какие вещи можно привести в порядок дома, а какую лучше доверить профессионалам

VOICE
Русско-американские отношения в XIX веке. Часть 2 Русско-американские отношения в XIX веке. Часть 2

Какими были отношения США и России накануне войны между Севером и Югом

Наука и техника
Мимоза Мимоза

Героиня рассказа Лены Бурковой учится находить радость в простых вещах

Grazia
6 самых популярных сюжетов снов 6 самых популярных сюжетов снов

Какие сюжеты снов чаще всего снятся людям?

ТехИнсайдер
Шляпки, розы и Симона Байлз: как скачки в Кентукки стали успешным спортивным ивентом Шляпки, розы и Симона Байлз: как скачки в Кентукки стали успешным спортивным ивентом

Как на ипподроме удалось создать яркие традиции и монетизировать их

Forbes
Как и зачем одна женщина записала и сохранила более 30 лет передач на ТВ в США Как и зачем одна женщина записала и сохранила более 30 лет передач на ТВ в США

Архив Мэрион Стокс — это уникальная хроника истории

ТехИнсайдер
Открыть в приложении