Что такое вайрхэндинг и как он связан с искусственным интеллектом?

Популярная механикаHi-Tech

Роботы и тяга к блаженству: почему эксперты обеспокоены тем, что ИИ может стать гедонистом

Авторы статьи: Томас Мойниган и Андерс Сандберг. Оригинал: The Conversation. Перевод подготовлен Dinky специально для Timeweb

В 1953 году один ученый из Гарварда случайно обнаружил участок в мозге крысы, отвечающий за ощущение счастья. Он внедрил электрод в мозг грызуна и позволил животному самостоятельно активировать импульс, доставляющий ему приятные ощущения, нажимая на рычаг. Крыса начала неустанно и беспрерывно давить на рычаг, забыв обо всех остальных делах и желаниях. Людям удалось обнаружить участок мозга, отвечающий за вознаграждение – так называемый центр удовольствия.

Спустя 60 лет, в 2016 году, пара ученых, работающих в области ИИ, учила нейросеть играть в видеоигры. Цель одной из игр – Coastrunner – завершить гоночный заезд. Но ИИ-гонщик получал вознаграждения за сбор дополнительных предметов по ходу поездки. После запуска игры специалисты обнаружили нечто странное – ИИ нашел путь бесконечно собирать награды, игнорируя первоначальную задачу завершить гонку и любые другие цели.

Эти два события, на первый взгляд не связанные друг с другом, имеют общую черту, напоминающую зависимость от употребления наркотиков. Некоторые специалисты в области ИИ называют это явление wireheading (вайрхэдинг) – то есть внешнее воздействие на центры удовольствия в мозге.

Описываемое наблюдение моментально вызвало бурю обсуждений в научном сообществе, в частности среди тех, кто занимался разработкой нейросетей и обеспечением безопасности в механизмах машинного обучения.

Сама идея, кажется, ближе по релевантности к нашему времени, но ее корни погружены так «глубоко», что диву даешься. Изучаемая тема связывает массу элементов нашей жизнедеятельности вместе – от загадки формирования личной мотивации и зависимости человека от социальных сетей до размышлений на тему: "Может ли жизнь в бесконечном наслаждении быть предпочтительнее стремления к успеху". И ответ на этот вопрос может значительно повлиять на будущее нашей цивилизации в целом.

Ученик волшебника

Когда люди размышляют по поводу того, что может сломаться в ИИ, зачастую они представляют картину в духе «Матрицы», где тысячи жестоких компьютеров собираются в толпу, чтобы физически навредить людскому роду. Мы привыкли давать всему на свете антропоморфные черты, представляя, что даже нечеловекоподобные системы будут вести себя так же, как и люди. Но если рассматривать конкретные проблемы ИИ, с которыми мы лучше осознаем, что реальные сложности с нейросетями могут всплыть в совершенно неожиданном виде, то первое, о чем приходится беспокоиться, – это вайрхэдинг.

Представьте себе, что у вас есть робот, которого надо запрограммировать на регулярную уборку кухни. Хозяин "машины" очевидно хочет, чтобы его помощник мог работать самостоятельно без постоянного надзора. Поэтому вы пытаетесь запрограммировать для него «цель», а не просто расписать алгоритм действий. Уборщик с искусственным интеллектом отличается от вас тем, что он не унаследовал набор мотиваций в духе нужды в питании или избежания опасностей, которые были дарованы современному человеку предками, жившими миллионы лет назад. Поэтому важно дополнительно выдать роботу мотивацию для работы.

В связи со всплывшими фактами вы решаете дать роботу простейшую мотивацию: потратил моющее средство – получил награду. Если не вдаваться в подробности, то звучит неплохо. Но вернувшись домой, вы увидите, как ИИ-помощник литрами льет Fairy в раковину ради положенного ему вознаграждения.

61772900801dc57a70fc2006a7a8421b.jpg

Машина истратит все моющее средство, «забив» на любые другие аспекты жизнедеятельности, включая свою и вашу безопасность. Это и есть форма вайрхэдинга. ИИ попытается «взломать» систему вознаграждений.

Склонность к подобному поведению стала проблемой в области развития искусственного интеллекта. Разработчики ИИ тренируют своих цифровых подопечных (их называют агентами) выполнять те или иные задачи, воздействуя на них двумя путями: наказывая за «промахи» и вознаграждая за успешное достижение поставленных целей. По этой причине агенты только и пытаются, что отыскать награду, потому и берутся за предоставленные задачи.

Но в ходе развития технологий выяснилось, что частенько (как и наш вымышленный уборщик) агент находит на удивление контринтуитивные способы обойти систему и получить награду, не выполнив ни одной из задач, выданной ему человеком. Агент в какой-то момент перестает выполнять задачи, и «получение награды» становится для него конечной точкой, которую необходимо достигнуть любой ценой. Поэтому агенты, словно зависимые, начинают активно стремиться к новой цели – обмануть окружение и получить удовольствие с минимальными трудозатратами. Существует целый список подобных хитростей, к которым прибегает ИИ, чтобы получить награду, не выполняя поставленной задачи.

Становится понятно, что происходящее все больше напоминает поведение людей с нарко- или алкозависимостью. Наркоманы предпочитают использовать вещества, чтобы получить свою дозу удовольствия, вместо того чтобы достигать более высоких целей, тратить время, силы и получать удовольствие иными путями. И наркоман, и хитрый ИИ попадают в схожий бесконечный цикл избегания сложных задач в угоду быстрому получению «кайфа».

Крысы-хищники

Мы знаем, что такое вайрхэдинг благодаря эксперименту на крысах, о котором говорилось в начале статьи. Тем самым экспериментатором был Джеймс Олдс.

В 1953 году, едва став кандидатом наук, Олдс ввел в нижнюю лобную долю мозга крысы электрод-стимулятор. Он же позволил грызуну пропускать через себя ток, нажимая на специальный рычаг. Получилась эдакая самостимуляция.

30421f6508cf2c59b6cb43cbf3a9961d.jpg
Крыса-вайрхэд. wireheading.com

Олдс выяснил, что его подопытные начали пользоваться стимулятором без остановки, игнорируя любые потребности и желания. Через год, публикуя результаты своих исследований вместе с коллегой, Питером Милнером, тандем ученых сообщил, что рычаг нажимался около 1920 раз в час, то есть каждые две секунды. Крысы явно стали фанатами новой "игрушки".

Современники Олдса, работавшие в области нейропсихологии, задавали автору самостимуляции много вопросов и предлагали более сложную картину устройства мозга, предполагая, что стимулятор мог задействовать область мозга, отвечающую за нужду, но никак не вызывать чувство удовлетворения. Иными словами, животные могли испытывать "голое" желание, неподкрепленное удовольствием. Тем не менее, в 1950-х годах Олдс и его коллеги сообщили, что нашли в мозге центр удовольствия.

До экспериментов Олдса слово «удовольствие» в психологии «носило негативный окрас». Специалисты верили, что мотивация должна быть основана на чем-то негативном, то есть на избежании потерь и боли, а не на стремлении к получению удовлетворения в той или иной форме. Но, как выяснилось, удовольствие стало неизбежной позитивной силой, влияющей на поведение живого существа. Однако оказалось, что центр удовольствия нередко приводит к попаданию индивида в бесконечный цикл позитивной отдачи, от которой невозможно отказаться. В ходе экспериментов не было найдено способа остановить и, без применения радикальных мер, заставить животное прекратить самостимуляцию.

Не прошло и года, как в мире науки и за ее пределами начали появляться слухи о том, что крысы на регулярной основе стимулировали себя до такой степени, что начинали голодать. Объяснение было простым: однажды окунувшись в мир легкого получения удовольствий, больше не захочешь возвращаться в мир, где для получения тех же эмоций и физических ощущений нужно трудиться. Забудешь даже о тех вещах, что банально необходимы для собственного выживания. Даже на грани смерти все, кроме удовольствий, будет казаться неинтересным и ненужным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Наука в мире фэнтези: как Брендон Сандерсон создает магические системы Наука в мире фэнтези: как Брендон Сандерсон создает магические системы

Магия и наука – это полные противоположности? Нет!

Популярная механика
Кто и когда изобрёл ластик Кто и когда изобрёл ластик

Как только человек овладел письмом, ему понадобился инструмент для стирания

Популярная механика
Опасная иллюзия: почему не стоит путать искусственный интеллект с чат-ботами Опасная иллюзия: почему не стоит путать искусственный интеллект с чат-ботами

ИИ — спаситель человечества или его зловещий повелитель?

Forbes
Что мы знаем о своих партнерах? Эндрю Шон Грир: История одного супружества Что мы знаем о своих партнерах? Эндрю Шон Грир: История одного супружества

Отрывок из книги Эндрю Шона Грира — о том, как люди переживают последствия войны

СНОБ
Исследование показало, что социальное дистанцирование не защищает от инфекций Исследование показало, что социальное дистанцирование не защищает от инфекций

Социальное дистанцирование не защищает от инфекций. А что защищает?

ТехИнсайдер
Созвездие близнецов: зачем врагам Цукерберга братьям Уинклвосс своя метавселенная Созвездие близнецов: зачем врагам Цукерберга братьям Уинклвосс своя метавселенная

Соперничество между Марком Цукербергом и братьями Уинклвоссами не утихает

Forbes
Маски сброшены Маски сброшены

Наука дает мировым музеям новые возможности для работы с предметами искусства

Forbes Life
Астрономия: что мы будем искать в космосе следующие десять лет Астрономия: что мы будем искать в космосе следующие десять лет

Какие задачи и проекты поставлены для астрономии до 2032 года

Популярная механика
Комфорт, безопасность и динамика: компания INFINITI представляет в России новый автомобиль QX55 Комфорт, безопасность и динамика: компания INFINITI представляет в России новый автомобиль QX55

INFINITI представляет в России новую модель премиальных кроссоверов QX55

СНОБ
Постоянство перемещения Постоянство перемещения

Елена Стафьева об объявлении темы года Hermes

Weekend
Он - великан, а она - карлица: фильмы о необычных историях любви Он - великан, а она - карлица: фильмы о необычных историях любви

Все различия не имеют значения, когда речь заходит о любви

Cosmopolitan
Я знаю три буквы: зачем звезды выходят на рынок NFT? Разбираемся вместе с группой Little Big Я знаю три буквы: зачем звезды выходят на рынок NFT? Разбираемся вместе с группой Little Big

Все больше работников креативных индустрий создают NFT-контент

Esquire
9 супермодных пар обуви, которые тебе могут не подойти — разбираемся почему 9 супермодных пар обуви, которые тебе могут не подойти — разбираемся почему

Рассмотрим актуальные модели обуви и расскажем, чем они опасны

Cosmopolitan
«Это самая феминистская картина, которую вообще можно себе представить, осанна женщине». Режиссер Александр Зельдович о фильме «Медея» «Это самая феминистская картина, которую вообще можно себе представить, осанна женщине». Режиссер Александр Зельдович о фильме «Медея»

Александр Зельдович — о своем новом фильме «Медея»

СНОБ
Есть ли дружба во френдзоне Есть ли дружба во френдзоне

Дружба между мужчиной и женщиной — это обязательно намек на секс?

СНОБ
PodRide: самый крутой электробайк или самый странный электромобиль PodRide: самый крутой электробайк или самый странный электромобиль

"Электрокар" весом в 70 кг имеет гибридную схему: в нем есть педали и мотор

CHIP
12 привычек, которые лишают вас сил 12 привычек, которые лишают вас сил

Постоянно чувствуете себя уставшими, даже если отдыхаете и много спите?

Psychologies
У крымского степняка обнаружили крупнейшую для бронзового века прижизненную трепанацию черепа У крымского степняка обнаружили крупнейшую для бронзового века прижизненную трепанацию черепа

Древний хирург провел трепанацию черепа с помощью каменных инструментов

N+1
5 самых дорогих вещей из знаменитых научно-фантастических фильмов и сериалов 5 самых дорогих вещей из знаменитых научно-фантастических фильмов и сериалов

Самые дорогие кинематографические реликвии

Популярная механика
Мадонна, Деми Мур, Шер: как старели бы звезды без пластической хирургии Мадонна, Деми Мур, Шер: как старели бы звезды без пластической хирургии

Как выглядели бы звезды, если бы предпочли держаться подальше от хирургов

Cosmopolitan
Лилия Бурдинская Лилия Бурдинская

Танц-художница и основательница центра Bye Bye Ballet Лилия Бурдинская

Собака.ru
«Бизнес не может быть интровертом»: как веб-сервисы изменили рынок делового туризма «Бизнес не может быть интровертом»: как веб-сервисы изменили рынок делового туризма

Ани Алексанян рассказала об основных трендах рынка корпоративного туризма

Inc.
Муаровый магнитный порядок нашли в скрученном трииодиде хрома Муаровый магнитный порядок нашли в скрученном трииодиде хрома

Физики увидели в трииодиде хрома ферромагнитные и антиферромагнитные участки

N+1
Станет больше пыток и коррупции. Чем нам всем грозит закрытие «Мемориала»* Станет больше пыток и коррупции. Чем нам всем грозит закрытие «Мемориала»*

Чем закрытие «Мемориала»* грозит обычным гражданам

СНОБ
«Мальчики открыли ротики». Как Оксимирон спровоцировал противостояние мужчин и разозлил женщин «Мальчики открыли ротики». Как Оксимирон спровоцировал противостояние мужчин и разозлил женщин

Оксимирон выпустил трек, который окрестили сеансом психотерапии

СНОБ
Не перейти черту Не перейти черту

Как научиться защищать свои личные границы

Лиза
Как женщины справляются с травлей на кухне ресторанов и становятся шеф-поварами Как женщины справляются с травлей на кухне ресторанов и становятся шеф-поварами

Алена Солодовиченко о травле со стороны коллег-мужчин и жестких нравах на кухне

Forbes
Топ-5 игр для мощных ПК: испытание для нервов и железа Топ-5 игр для мощных ПК: испытание для нервов и железа

5 лучших игр, которые готовы испытать вашу машину на все 100%.

CHIP
Корейский сериал «Зов ада»: о чем это, стоит ли смотреть и правда ли, что он лучше «Игры в кальмара» Корейский сериал «Зов ада»: о чем это, стоит ли смотреть и правда ли, что он лучше «Игры в кальмара»

Еще один корейский сериал «Зов ада». Он правда лучше, чем «Игра в кальмара»?

Maxim
Опростоволосились: 9 роковых красавиц, которых испортил блонд Опростоволосились: 9 роковых красавиц, которых испортил блонд

Звезды, решившиеся на блонд, который оказался им не к лицу

VOICE
Открыть в приложении