Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Горький привкус: почему не останавливается отток населения из Нижнего Новгорода Горький привкус: почему не останавливается отток населения из Нижнего Новгорода

Из-за каких причин жители вроде бы процветающего Нижнего покидают город?

Forbes
Непонятный кодекс Непонятный кодекс

Юристы пожаловались на усложнение налоговых норм для восприятия

Ведомости
Что такое «зима искусственного интеллекта» и когда ее ждать Что такое «зима искусственного интеллекта» и когда ее ждать

Что происходит во время «зимы искусственного интеллекта»?

ТехИнсайдер
Как преобразить ногти за 30 дней: советы мастера маникюра Как преобразить ногти за 30 дней: советы мастера маникюра

Как укрепить и подпитать ногти всего за четыре недели?

VOICE
Простой способ повысить психологическую устойчивость и настроиться на позитив Простой способ повысить психологическую устойчивость и настроиться на позитив

Одно упражнение для поддержания психологической устойчивости

Inc.
«Сейчас период повышения внутренней эффективности» «Сейчас период повышения внутренней эффективности»

Дмитрий Фосман — о перспективах развития экспорта и работе по привлечению кадров

Агроинвестор
Питание по расписанию. Без чувства голода Питание по расписанию. Без чувства голода

Достичь идеального веса, не голодая? Это возможно с хронодиетой

Лиза
Продлили срок: что можно сделать из бывших тюрем Продлили срок: что можно сделать из бывших тюрем

Как бизнесмены и государство развивают бывшие тюрьмы

Forbes
Если все тряпки закончились: 5 предметов домашнего обихода, которыми можно вытирать пыль Если все тряпки закончились: 5 предметов домашнего обихода, которыми можно вытирать пыль

Чем, кроме тряпки, можно эффективно удалить пыль с любой поверхности

ТехИнсайдер
Земля ратного подвига Земля ратного подвига

Щит России: чем живёт и развивается Белгородская область сегодня

Отдых в России
Библиотекам подключат рекомендации Библиотекам подключат рекомендации

Как помочь библиотекам выявлять нарушающие законы издания?

Ведомости
Энтомофагия Энтомофагия

Насколько употребление в пищу насекомых безопасно для жителей России?

Здоровье
Жила-была золотая рыбка Жила-была золотая рыбка

Как золотые рыбки из аквариумов угрожают экологии

Наука и жизнь
Семнадцать мгновений Победы Семнадцать мгновений Победы

Лиознова сняла не просто ленту, а культовую, всенародно любимую картину

Коллекция. Караван историй
Островский – революция в русском театре Островский – революция в русском театре

Гончаров, известный трилогией на букву «О», был интересным и метким критиком

Знание – сила
Тонны мусора: как современная экономика заставляет нас увеличивать количество отходов Тонны мусора: как современная экономика заставляет нас увеличивать количество отходов

О том, как гражданское общество в России строит систему сокращения отходов

Forbes
Как тебя зовут? Как тебя зовут?

Что такое число имени и как оно влияет на судьбу

Лиза
Алексей Гореславский: Контент не кирпич, который просто лежит на платформе Алексей Гореславский: Контент не кирпич, который просто лежит на платформе

ИРИ – организация, которая поддерживает производство онлайн-контента

Ведомости
Не Казань и даже не Сочи: 10 мест в России, куда мечтают поехать в отпуск россияне Не Казань и даже не Сочи: 10 мест в России, куда мечтают поехать в отпуск россияне

Лето не за горами: пора определяться с локацией для нового путешествия

Maxim
«Картинки» натуралиста «Картинки» натуралиста

Что отражено в русских названиях птиц из семейства куликов?

Наука и жизнь
Если села батарейка Если села батарейка

20 способов восстановиться за 15 минут

Лиза
Мяч в кольце Мяч в кольце

Спортивные события второго года Великой Отечественной войны

Ведомости
Зал ожиданий Зал ожиданий

Для психического здоровья фитнес даже полезнее, чем для физического

VOICE
Мужчина мечты Мужчина мечты

Хочет ли Ярослав Могильников остаться в кино и как проходят его первые свидания

VOICE
Блеск и несчастья «Великого Гэтсби» Блеск и несчастья «Великого Гэтсби»

Краткая история главного американского произведения 1920‑х

Weekend
Татьяна Геворкян: «С годами на лице проявляются все эмоции, которые мы проживали» Татьяна Геворкян: «С годами на лице проявляются все эмоции, которые мы проживали»

Телеведущая Татьяна Геворкян о том, как выглядеть стильно без больших затрат

Здоровье
Чудо-молекулы Чудо-молекулы

Зачем нашей коже нужны ниацинамид и эктоин

Лиза
Керосиновая история Керосиновая история

Жизнь в послевоенном социализме делится на «время керосина» и «время газа»

Знание – сила
Маме не говори Маме не говори

О чем не стоит рассказывать даже маме? Вернее – особенно ей?

VOICE
Ее уже не спасти: 7 признаков того, что вам пора заменить духовку Ее уже не спасти: 7 признаков того, что вам пора заменить духовку

Признаки, сигнализирующие о том, что духовка нуждается в замене

ТехИнсайдер
Открыть в приложении