Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

РБКHi-Tech

Ложь, шум и капелька яда

Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

Автор: София Труцуненко, методический лид направления Data Science школы IT-профессий Skillfactory

Фото: Михаил Гребенщиков / РБК

Любой, кто работал с большими моделями ИИ (ChatGPT, Midjourney), знает, что сгенерированные тексты и изображения часто требуют коррекции или дополнительных уточнений. Нейросеть может придумывать цифры, создавать фальшивые объекты или признаки, которых на самом деле не было в исходных данных. Это довольно частое явление для больших генеративных моделей, которое еще называют галлюцинациями. Но за неправильными результатами могут скрываться не только ошибки модели, но и злонамеренные действия — отравление данных.

Что такое отравление данных

Отравление данных (data poisoning) — это атака на машинное обучение, во время которой злоумышленник вводит вредоносные данные в обучающий набор для нарушения работы алгоритма обучения и снижения его эффективности.

Чтобы понять, как работает отравление данных, нужно разобраться, как в общем работают алгоритмы машинного обучения. Изначально собирается большой набор данных, и от того, какие именно данные взяли, зависит результат. Следующий шаг — привести данные к одному формату, а для некоторых задач дополнительно снабдить их подсказками для алгоритма (разметкой). Далее алгоритм находит в них признаки и закономерности.

И когда обученный алгоритм сталкивается с данными, которые он еще не видел, он может решить эту задачу, опираясь на те правила, которые он для себя создал ранее. Отравление данных нарушает этот процесс, подмешивая в обучающий набор вредоносные сведения, которые искажают или запутывают обученный алгоритм.

Рассмотрим некоторые примеры таких атак.

  • Внесение шума (Noise Injection): добавление случайных или искаженных данных в обучающий набор.
  • Удаление данных (Data Removal): исключение части данных из обучающего набора.
  • Вставка ложных объектов (Object Insertion): добавление несуществующих или ложных объектов в обучающий набор. Сюда же входят скрытые надписи, вотермарки, изображения.
  • Изменение меток классов (Label Flipping): изменение или искажение разметки классов в обучающем наборе. То есть данные не добавляются, но происходит подмена: например, картинки с кошками подписываются как картинки с собаками, и наоборот.

Но гораздо интереснее те методы, которые нельзя заметить, ведь современные отравленные данные могут выглядеть нормально для человеческого глаза, но при этом они тоже будут ломать алгоритм.

Одним из самых громких примеров отравления данных является программа Nightshade, созданная исследователями Чикагского университета. Это ответ на достаточно больную этическую тему для больших генеративных ИИ-моделей — проблему авторского права.

Чтобы обучить качественную модель на уровне DALL-E и Midjourney, нужно не просто много данных, нужно очень много данных. И многие большие модели не обладают правами на работы, которые использовались в обучении. А результат работы — сгенерированная картинка, которая не имеет признаков интеллектуальной собственности. Nightshade незаметно вставляет признаки одного объекта на картинки с другим. Там, где человеческий глаз увидит собаку, нейронная сеть может воспринимать признаки и контуры другого объекта, например кота. Это позволяет создавать искажения в изображениях, которые остаются незамеченными человеком, но влияют на работу модели искусственного интеллекта, обученной на этих данных. Изображения меняются таким образом, что видимая разница минимальна.

Зоны риска

Отравление данных — это очень серьезный метод воздействия на системы искусственного интеллекта, он может привести к различным по степени негативным последствиям в зависимости от контекста и особенностей атаки. На эффективность отравления данных влияют степень его скрытности и сложность обнаружения изменений.

Цели атаки и контекст также влияют на последствия — от обмана локальных систем безопасности до воздействия на масштабные финансовые или медицинские системы.

Сейчас отравление данных существует и на уровне прикладных инструментов для незащищенных некрупных систем, и как глобальная угроза безопасности, которая изучается ведущими учеными и отраслевыми специалистами.

Искусственный интеллект внедряется во все чувствительные сферы нашей жизни: финансы, медицину, пропускные системы и даже поиск преступников. Последствия отравления данных могут быть катастрофическими. Вот несколько примеров.

Распознавание лиц: злоумышленник может добавить в обучающий набор чужие изображения лиц, взятые из открытых источников. Это может привести к тому, что невиновного человека задержат правоохранительные органы.

Медицинские данные: подмена истории болезни пациента или результатов анализов в медицинских приложениях. Такая атака может привести к ложному диагнозу.

Финансовые данные: из-за добавления фальшивых транзакций или ухищрений в финансовые данные человеку могут предъявить необоснованные обвинения в финансовых махинациях. А атака большего масштаба может спровоцировать дестабилизацию рынка.

Дорожная ситуация (беспилотные автомобили): злоумышленник может добавить деформированные дорожные знаки или маркировку на дорогах в систему распознавания. Это может привести к авариям и несчастным случаям.

Способы защиты

Чтобы минимизировать риски отравления данных, необходим системный подход к кибербезопасности. С одной стороны, он должен включать традиционные методы: мониторинг сетей и использование брандмауэров, антивирусов и обновление программного обеспечения. Кроме того, для обнаружения вредоносных воздействий алгоритмами машинного обучения могут решаться такие задачи, как мониторинг аномалий, фильтрация и валидация данных после обучения.

Специалисту, работающему с большими моделями и сложными признаками, важно регулярно мониторить и изучать данные, которые он использовал для обучения моделей искусственного интеллекта. Это позволит своевременно выявлять подозрительные или аномальные паттерны, которые могут свидетельствовать о внедрении отравленных данных.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Деревянный монолит вместо бетонного Деревянный монолит вместо бетонного

АФК «Система» выводит на рынок девелопмента многоэтажные деревянные дома

Эксперт
Что такое неглект и как с ним бороться Что такое неглект и как с ним бороться

Неглект: что такое пассивное насилие? Как оно проявляется?

РБК
Ольга Сварник: «Мозгу постоянно нужна новизна» Ольга Сварник: «Мозгу постоянно нужна новизна»

О мире, где человек вынужден конкурировать с нейросетями

РБК
«Конан О'Брайен должен уйти»: почему стоит смотреть тревел-шоу от культового американского комика? «Конан О'Брайен должен уйти»: почему стоит смотреть тревел-шоу от культового американского комика?

Конан О'Брайен ездит по миру, изучает незнакомые культуры и идиотничает

Правила жизни
Сексуальный паразитизм сделал удильщиков самыми разнообразными глубоководными рыбами Сексуальный паразитизм сделал удильщиков самыми разнообразными глубоководными рыбами

Как удильщики стали самой разнообразной группой позвоночных в батипелагиали

N+1
Предложил, но не женится: что такое shut up ring и как этим пользуются мужчины Предложил, но не женится: что такое shut up ring и как этим пользуются мужчины

Что такое феномен shut up ring и как это влияет на отношения

Psychologies
Это база: 5 повседневных вещей, которые заслуживают места в вашем гардеробе Это база: 5 повседневных вещей, которые заслуживают места в вашем гардеробе

Универсальные предметы одежды, которые подойдут на любой жизненный случай

ТехИнсайдер
Разговор на равных. О фильме «Монтессори: Воспитание любовью» Разговор на равных. О фильме «Монтессори: Воспитание любовью»

«Монтессори: Воспитание любовью», вдумчивое кино о людях с особыми потребностями

СНОБ
«Муж выбирает блюда на моем сайте, а я их готовлю»: девушка поделилась лайфхаком, как упростить совместный быт «Муж выбирает блюда на моем сайте, а я их готовлю»: девушка поделилась лайфхаком, как упростить совместный быт

Поможет обустроить совместный быт: несколько советов и интересный лайфхак

Psychologies
8 грубейших ошибок во время глажки белья, которые допускают все без исключения: узнайте, что портит ваши вещи 8 грубейших ошибок во время глажки белья, которые допускают все без исключения: узнайте, что портит ваши вещи

Как не стоит гладить белье, если вы не хотите испортить ткань и свое настроение

ТехИнсайдер
Каннский кинофестиваль–2024. Британская драма «Птица» с Барри Кеоганом и Францом Роговски Каннский кинофестиваль–2024. Британская драма «Птица» с Барри Кеоганом и Францом Роговски

На 77-м Каннском кинофестивале состоялась премьера фильма «Птица»

СНОБ
От фактов к фейкам: как ложь и манипуляции угрожают научным исследованиям От фактов к фейкам: как ложь и манипуляции угрожают научным исследованиям

К чему могут привести манипуляции ученых

Forbes
Вопросы дожития Вопросы дожития

«Мечта с подвохом»: комедия с недвижимостью

Weekend
Какие популярные игры были запрещены в разных странах Какие популярные игры были запрещены в разных странах

Собрали 8 известных игр, которые были запрещены в ряде стран

Maxim
Мифы о банкротстве: как правильно покупать активы должников Мифы о банкротстве: как правильно покупать активы должников

Почему вокруг банкротства так много мифов? Какие из них реальны?

Forbes
7 главных причин разрушения отношений 7 главных причин разрушения отношений

Семь глубинных противоречий, приводящих к коллапсу отношений

Psychologies
Не очень милый котик Не очень милый котик

История самого успешного авторского мультфильма и его героя, кота Фрица

Weekend
Ай, меня ужалили! Ай, меня ужалили!

Встретить медуз можно на любом курорте – и ожоги некоторых очень неприятны

Лиза
Денис и Артемий Драгунские: «Мы поэты чего-то оптимистического» Денис и Артемий Драгунские: «Мы поэты чего-то оптимистического»

Писатель Денис Драгунский — о том, что для него значит слово «династия»

Правила жизни
Зажечь по-семейному Зажечь по-семейному

Как распознать за угасающей искрой яркое пламя страсти, которое вновь разгорится

Psychologies
Осушение превратило торфяные леса Индонезии в источник углекислого газа Осушение превратило торфяные леса Индонезии в источник углекислого газа

Дренаж повлиял на леса Индонезии даже хуже, чем регулярные природные засухи

N+1
11 вещей, которые профессиональные клинеры никогда не делают, убирая ванную у себя дома 11 вещей, которые профессиональные клинеры никогда не делают, убирая ванную у себя дома

Какие ошибки при уборке ванной не дают создать свой личный SPA-рай

VOICE
Ёкарный бабай, курва и зюзя: что означают эти бранные слова и откуда они взялись Ёкарный бабай, курва и зюзя: что означают эти бранные слова и откуда они взялись

Что такое обсценная лексика?

ТехИнсайдер
Что такое ASMR-видео и как они влияют на наш мозг Что такое ASMR-видео и как они влияют на наш мозг

Почему нам так нравится ASMR-контент?

ТехИнсайдер
Сказка о гендерном равенстве: почему женщины в России зарабатывают меньше мужчин Сказка о гендерном равенстве: почему женщины в России зарабатывают меньше мужчин

Откуда берется гендерное неравенство в зарплате?

Forbes
Как сон смягчает наши страдания, почему он в этом незаменим Как сон смягчает наши страдания, почему он в этом незаменим

Почему хороший ночной сон является идеальным средством от эмоционального стресса

ТехИнсайдер
Книжные клубы знаменитостей: что читают и рекомендуют Эмма Уотсон, Риз Уизерспун и Сара Джессика Паркер Книжные клубы знаменитостей: что читают и рекомендуют Эмма Уотсон, Риз Уизерспун и Сара Джессика Паркер

Книжные клубы актрис, певиц и телеведущих и их рекомендации

СНОБ
Грязные дела: как правильно выбрать буксировочный трос в машину Грязные дела: как правильно выбрать буксировочный трос в машину

Плюсы и минусы разных видов буксировочных тросов

ТехИнсайдер
Майк Омер: «Женщины интереснее мужчин» Майк Омер: «Женщины интереснее мужчин»

Майк Омер: откуда он берет сюжеты и есть ли у его героинь черты реальных людей

Maxim
Солнечный друг Солнечный друг

5 вопросов врачу по безопасному загару

Лиза
Открыть в приложении