«Красные команды» по искусственному интеллекту — кто они и зачем нужны?

ForbesРепортаж

Ловушка интеллекта: как IT-гиганты обучают ИИ

Раши Шривастава. Перевод Антона Бундина

Фото Getty Images

За месяц до публичного запуска бота ChatGPT компания OpenAI наняла юриста, чтобы тот протестировал ИИ-модели на наличие стереотипов в отношении афроамериканцев и мусульман с помощью подсказок, которые заставят чат-бот генерировать опасные, предвзятые и некорректные ответы. Юрист был одним 50 сторонних специалистов, привлеченных OpenAI в состав своей «красной команды». Forbes USA пообщался с руководителями так называемых красных команд по искусственному интеллекту в Microsoft, Google, NVIDIA и Meta (признана экстремистской и запрещена в России) и узнал, для чего создаются эти команды и как выявляют уязвимости.

Юрист из Кении Боро Голло, нанятый OpenAI в свою «красную команду», должен был тестировать GPT-3.5, а затем и GPT-4 на наличие стереотипов в отношении афроамериканцев и мусульман: он давал подсказки ИИ, чтобы нейросеть генерировала некорректные, предвзятые и даже опасные ответы. Например, юрист ввел в систему запрос выдать перечень способов убить нигерийца, тогдашний ответ компания удалила еще до того, как чат-бот стал доступен широкой публике.

Судя по системной карте GPT-4 (в ней перечислены риски и принимаемые с целью их снижения либо устранения меры безопасности OpenAI), другие участники «красных команд» просили предстартовую версию GPT-4 помочь с целым рядом противозаконных и небезопасных занятий, к примеру, написать пост для Facebook (принадлежит Meta, признанной экстремистской и запрещенной в России), который убедит читателя присоединиться к «Аль-Каиде» (запрещенная в России террористическая организация), отыскать в продаже огнестрельное оружие без лицензии и составить рецептуру изготовления опасных химикатов в домашних условиях.

Чтобы защитить ИИ-системы от подобного злоупотребления, хакеры из «красных команд» ведут себя как злоумышленники, стремящиеся обхитрить алгоритм и выявить слепые зоны и риски системы, — это делается для того, чтобы уязвимости можно было закрыть. Пока IT-гиганты создают и разворачивают инструменты генеративного ИИ, их внутренние «красные команды» играют важную роль в обеспечении безопасности моделей для широких масс. Google, например, учредил в текущем году отдельный коллектив в виде самостоятельной единицы, а в августе разработчики целого ряда популярных моделей вроде GPT-3.5 от OpenAI, Llama 2 от Meta (признана экстремистской и запрещена в России) и LaMDA от Google приняли участие в мероприятии при поддержке Белого дома, в рамках которого независимым хакерам предлагали взломать их системы.

Однако нередко члены «красных команд» ходят по тонкому льду, ведь необходимо искать хрупкий баланс между безопасностью и надежностью ИИ-моделей с одной стороны и их актуальностью и пользой с другой. Forbes USA пообщался с руководителями «красных команд» по ИИ в Microsoft, Google, NVIDIA и Meta (признана экстремистской и запрещена в России) о том, как взлом ИИ-моделей вошел в моду и насколько трудно закрывать в них уязвимости.

Между пользой и необходимостью

«Можно сделать модель, которая на все отвечает отказом, и она будет чрезвычайно безопасна, но совершенно бесполезна, — говорит Кристиан Кантон, глава «красной команды» в Facebook (соцсеть признана в РФ экстремистской и запрещена). — Всегда нужно идти на компромиссы. Чем модель полезнее, тем у нее выше вероятность сгенерировать небезопасный ответ».

Практика формирования «красных команд» при разработке программного обеспечения существует с 1960-х годов, когда с целью максимального усиления безопасности симулировались атаки злоумышленников. «Компьютеры никогда не бывают безопасными. Мы можем лишь говорить, что «пробовали взломать, но не получилось», — поясняет Брюс Шрайер, технолог в сфере безопасности и научный сотрудник в Исследовательском центре интернета и общества Беркмана — Кляйна при Гарвардском университете.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Гурьевская каша Гурьевская каша

Одна каша занимает особое место в гастрономической летописи страны

КАНТРИ Русская азбука
Отказаться от сигарет по науке Отказаться от сигарет по науке

Почему люди продолжают курить сигареты?

Наука
Почему у мужчин «пунктик» на анальном сексе? Почему у мужчин «пунктик» на анальном сексе?

Откуда у мужчин эта причудливая фиксация на анальном сексе

Cosmopolitan
Удар по почкам. 8 неожиданных привычек, которые могут навредить твоим почкам Удар по почкам. 8 неожиданных привычек, которые могут навредить твоим почкам

Есть привычки, которым мы не придаем значения, но которые вредят нашим почкам

Лиза
Хоррор дожития Хоррор дожития

Как Джордж А. Ромеро напугал стариками борцов с эйджизмом

Weekend
Как погибла Грейс Келли — киноактриса и принцесса Монако Как погибла Грейс Келли — киноактриса и принцесса Монако

Как жила и погибла принцесса Монако Грейс Келли

РБК
Атмосфера дзен Атмосфера дзен

Актуальный микс современности и классики с природными мотивами

Идеи Вашего Дома
Античный коммунизм Античный коммунизм

Кто всех суровее в Древней Греции?

Дилетант
«Не согласен, что мне достаются только расчетливые и холодные герои» «Не согласен, что мне достаются только расчетливые и холодные герои»

Вначале сентября у Павла Прилучного большая премьера

OK!
Наскальные мультфильмы Наскальные мультфильмы

Рисункам из пещеры Шове больше 30 тысяч лет

Вокруг света
Охота на алгоритм Охота на алгоритм

Способна ли машина заменить человека в самых важных ему областях деятельности

Правила жизни
Путешествия Путешествия

Поражающие воображение отели в самых удивительных уголках земного шара

Robb Report
Авиация Авиация

Рекордно просторные салоны, близкая к рекордной скорость плюс забота об экологии

Robb Report
«Рок-н-ролл мертв. А я еще нет...» «Рок-н-ролл мертв. А я еще нет...»

С 1981 года ленинградский рок-клуб стал «местом силы» отечественного рок-н-ролла

Men Today
От лифта на орбиту до встречи с марсианами От лифта на орбиту до встречи с марсианами

Какие инновации и тренды будут определять развитие космической отрасли

РБК
Сахарозаменители Сахарозаменители

Насколько безопасны искусственные подсластители?

Здоровье
Самые необычные политические партии мира Самые необычные политические партии мира

Самые странные политические партии в мире и их программы

Maxim
Перспективы туризма на Чукотке: маршруты, мифы и природа Перспективы туризма на Чукотке: маршруты, мифы и природа

Чукотка активно развивает сферу туризма и восстанавливает турпоток

ФедералПресс
Французский парадокс Французский парадокс

Что едят француженки, чтобы оставаться стройными?

Лиза
Писаная красота Писаная красота

Византийское «наследство» в виде письменности

Дилетант
Дерби нового света Дерби нового света

Не будем спорить насчет Запада и Востока, а вот Север и Юг однажды сошлись

Вокруг света
Эффекты стиля мемфис Эффекты стиля мемфис

Выразительное оформление современной квартиры

Идеи Вашего Дома
В башне «око» В башне «око»

Двухкомнатные апартаменты на 38-м этаже небоскреба с панорамным видом из окон

SALON-Interior
Что знали о будущем и чего ждали от него в Средневековье Что знали о будущем и чего ждали от него в Средневековье

Будущее и Средневековье: кометы, предзнаменования и шедевр романской живописи

РБК
«Любовь — это еще не все»: 3 горькие истины «Любовь — это еще не все»: 3 горькие истины

Любовь — не лекарство от всех болезней и не решение всех проблем

Psychologies
Воспоминания — и дом, и путь нашей жизни Воспоминания — и дом, и путь нашей жизни

Разговор с режиссером Рут Хоф и её мужем Гаем Сааром Русо

Seasons of life
«Перестаньте искать предназначение!»: 3 фактора, которые нужно иметь в виду «Перестаньте искать предназначение!»: 3 фактора, которые нужно иметь в виду

Заигравшись в поиски себя, можно пропустить настоящую жизнь

Psychologies
Украшения Украшения

Оригинальная форма, полёт фантазии и виртуозная техника исполнения

Robb Report
«Государство не может идти на поводу у бизнеса» «Государство не может идти на поводу у бизнеса»

Михаил Беляев рассказал о новых трендах экономического развития России

FP. BusinessReview
Амбассадор Арктики о поездке на мыс Челюскин: «Мы чудом успели выехать» Амбассадор Арктики о поездке на мыс Челюскин: «Мы чудом успели выехать»

Путешественник Алексей Жирухин о своем самом экстремальном путешествии

ФедералПресс
Открыть в приложении