Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Антифашисты в немецких мундирах Антифашисты в немецких мундирах

Заговор против Гитлера окончился двойной неудачей

Дилетант
«Кодекс общежития»: как основатели Skyeng не сломались на старте «Кодекс общежития»: как основатели Skyeng не сломались на старте

Компания Skyeng смогла преодолеть несколько кризисов и не развалиться

Forbes
Как работает сила воли Как работает сила воли

Важные научные исследования, которые меняют наше представление о силе воли

Esquire
Радиация внутри нас: почему мы ежедневно облучаемся Радиация внутри нас: почему мы ежедневно облучаемся

Как сильно мы облучаемся каждый день и насколько опасно это для нашего здоровья?

Популярная механика
Проявить внимание Проявить внимание

Снимки, сделанные в СССР и России с конца 1940-х до наших дней

Esquire
Как должны развиваться урбанизированые территории Как должны развиваться урбанизированые территории

Григорий Ревзин о городе будущего

Weekend
Олень, иди за мной Олень, иди за мной

Ксения Рождественская о «Пожаре» Дэвида Линча

Weekend
Победа телевидения над онлайном: как бизнес стимулирует продажи во время эпидемии Победа телевидения над онлайном: как бизнес стимулирует продажи во время эпидемии

Что происходит с рекламным рынком во время каратина и экономического спада?

Forbes
Художник Михаил Цатурян рассказал, как устроить выставку в Minecraft Художник Михаил Цатурян рассказал, как устроить выставку в Minecraft

Выставка в игре, на которой выступали рэперы и стендап-комики

GQ
Почему человек спит: таинственный механизм Почему человек спит: таинственный механизм

Как мозг заставляет человека пролежать почти без движения семь и более часов?

Популярная механика
Как устроен мозг маньяка-убийцы: мы отличаемся от них Как устроен мозг маньяка-убийцы: мы отличаемся от них

Что-то в этих преступниках не так, не по-человечески устроено

Популярная механика
Восточные практики для детей: это возможно? Восточные практики для детей: это возможно?

Можно ли мотивировать ребенка на занятия оздоравливающей восточной практикой?

Psychologies
5 главных опасностей космических путешествий 5 главных опасностей космических путешествий

Полеты в космос сопряжены с целым рядом трудностей

Популярная механика
Музыка тёмной материи: можно ли услышать “песню” невидимой Вселенной Музыка тёмной материи: можно ли услышать “песню” невидимой Вселенной

Что особенного в темной материи?

Популярная механика
Как скрыть следы похмелья: краткая инструкция Как скрыть следы похмелья: краткая инструкция

Несколько простых шагов, которые могут облегчить вам жизнь

Esquire
«Это просто удавка». Новый штраф для автомобилистов пропишут в КоАП «Это просто удавка». Новый штраф для автомобилистов пропишут в КоАП

Всех автомобилистов за езду без пропусков предложили штрафовать до 5 000 рублей

РБК
Разрушительная скупость. Как подготовка к затяжному кризису делает этот кризис затяжным Разрушительная скупость. Как подготовка к затяжному кризису делает этот кризис затяжным

Драматическое сокращение спроса в экономике

СНОБ
На перепутье: как безболезненно сменить профессию На перепутье: как безболезненно сменить профессию

Переход из одной специальности в другую затрагивает многие аспекты жизни

Psychologies
Свободный художник Свободный художник

Актриса Дарья Руденок о своем ярком образе в сериале «257 причин, чтобы жить»

OK!
«Туманная Дева»: первое электросудно Америки «Туманная Дева»: первое электросудно Америки

Суда на батарейках перестают быть редкостью

Популярная механика
Моя прелесть Моя прелесть

Марки, значки, открытки – в детстве все мы что-то коллекционировали

Лиза
Господин Плохие новости: как жил и работал Олден Уитмен, который десятилетиями писал некрологи для The New York Times Господин Плохие новости: как жил и работал Олден Уитмен, который десятилетиями писал некрологи для The New York Times

Каким был мастер составления некрологов Олден Уитмен?

Esquire
Все не так и все не то: виновата «плохая» энергия? Все не так и все не то: виновата «плохая» энергия?

Негативная энергия может сказываться на здоровье

Psychologies
Эффект природы Эффект природы

Современный минималистский интерьер Максима Гаевского

SALON-Interior
Выхода нет: 4 самые неприступные тюрьмы мира Выхода нет: 4 самые неприступные тюрьмы мира

Тюрьмы супермаксимальной безопасности, из которых невозможно сбежать

Maxim
«Да пребудет со мной сила!»: практики самоподдержки «Да пребудет со мной сила!»: практики самоподдержки

Для движения вперед нужен навык, который даст импульс для новых свершений

Psychologies
Самые известные психонавты Самые известные психонавты

Семь знаменитых первооткрывателей, практиковавших психонавтику

Популярная механика
3 упражнения, чтобы быстро снять эмоциональное напряжение 3 упражнения, чтобы быстро снять эмоциональное напряжение

Как справиться с напряжением, работая с телом у себя дома?

Psychologies
Потепление позволит зеленым водорослям продвинуться вглубь Антарктиды Потепление позволит зеленым водорослям продвинуться вглубь Антарктиды

На Антарктическом полуострове водоросли занимают почти два квадратных километра

N+1
Почему вы переживаете из-за его бывшей и как это остановить Почему вы переживаете из-за его бывшей и как это остановить

Желание побольше узнать о бывшей девушке партнера вполне естественно

Psychologies
Открыть в приложении