Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Хихическая атака: 10 смешных военных курьезов Хихическая атака: 10 смешных военных курьезов

Главные курьезы мировой военной истории

Maxim

10 самых экзотичных переложений европейских фильмов в Голливуде

Esquire
Почему мы стесняемся себя в постели? Почему мы стесняемся себя в постели?

В сериале «Девочки» Лина Данэм показала, как реальные женщины занимаются сексом

Cosmopolitan
Окно в Париж Окно в Париж

Хозяйка квартиры на Патриарших прудах захотела создать дома парижскую атмосферу

AD
У стеклянных лягушек описали новый тип камуфляжа У стеклянных лягушек описали новый тип камуфляжа

У тропических стеклянных лягушек обнаружили совершенно новый тип камуфляжа

N+1
Родные... и чужие Родные... и чужие

Нередко братья и сестры не ладят и даже испытывают неприязнь друг к другу

Лиза
Как изучают климат: 10 фактов о климатологии Как изучают климат: 10 фактов о климатологии

В чем разница между погодой и климатом и почему она так важна сегодня?

Популярная механика
Трофей противника: тест-драйв танка Трофей противника: тест-драйв танка

«Популярная механика» прокатилась на знаменитом немецком танке "Пантера"

Популярная механика
Жизнь после карантина. Аll-Terrain для коротких поездок Жизнь после карантина. Аll-Terrain для коротких поездок

Кроссоверы и внедорожники довольно часто обитают в городах

4x4 Club
Как устроен Chery Tiggo и китайский автопром Как устроен Chery Tiggo и китайский автопром

Компания Chery в последние годы вышла на совершенно новый уровень

4x4 Club
Рецепт счастья по-фински Рецепт счастья по-фински

В чем секрет финнов и какие факторы повышают удовлетворенность жизнью?

Psychologies
«Полнейшее отчаяние. Неужели так в каждой квартире?» «Полнейшее отчаяние. Неужели так в каждой квартире?»

Кафка, Буковски, Гоголь и другие о том, как достали соседи

Weekend
Вся чешусь и падаю без сил: как твое тело реагирует на токсичные отношения Вся чешусь и падаю без сил: как твое тело реагирует на токсичные отношения

Токсичные отношения действуют не только на психику, но и на тело тоже

Cosmopolitan
Дмитрий Михайлов: Почему тема Великой Отечественной войны стала главной в культурной политике государства Дмитрий Михайлов: Почему тема Великой Отечественной войны стала главной в культурной политике государства

У обращения к теме Великой Отечественной войны есть своя политическая логика

СНОБ
Осиновый кол при низкой температуре Осиновый кол при низкой температуре

Роторный испаритель, который пришел на кухню из научных лабораторий

Bones
Философия дуализмa Философия дуализмa

Британская певица Дуа Липа — о новом альбоме-манифесте и феминизме

Vogue
Опасные взгляды: как гендерные стереотипы мешают развивать экономику Опасные взгляды: как гендерные стереотипы мешают развивать экономику

Гендерные стереотипы мешают женщинам участвовать в экономике наравне с мужчинами

Forbes
«Кодекс общежития»: как основатели Skyeng не сломались на старте «Кодекс общежития»: как основатели Skyeng не сломались на старте

Компания Skyeng смогла преодолеть несколько кризисов и не развалиться

Forbes
Найден возможный антидот к нескольким змеиным ядам сразу Найден возможный антидот к нескольким змеиным ядам сразу

Врачи давно ищут универсальную “таблетку от укуса змеи”

Популярная механика
Как принять свои страх и злость: шпаргалка для родителей Как принять свои страх и злость: шпаргалка для родителей

Как научиться принимать свои чувства и сопереживать себе

Psychologies
8 способов отбросить сожаления 8 способов отбросить сожаления

Стоит ли долго заниматься самобичеванием, совершив ошибку и навредив кому-то?

Psychologies
Судный день: пять способов моментально уничтожить Землю Судный день: пять способов моментально уничтожить Землю

Самые апокалиптичные сценарии, которые могут превратить любой день в судный

Популярная механика
Экономия без боли: на чём сэкономить при покупке смартфона Экономия без боли: на чём сэкономить при покупке смартфона

Эти советы помогут выбрать новый смартфон без лишних трат

Популярная механика
Пушки острова Русский: как русская батарея наводила страх на японцев Пушки острова Русский: как русская батарея наводила страх на японцев

Оборона морских портов должна быть жесткой и несгибаемой

Популярная механика
Один дома, не считая собаки: как фотографы и их питомцы помогают друг другу на карантине (фотопроект) Один дома, не считая собаки: как фотографы и их питомцы помогают друг другу на карантине (фотопроект)

Оказавшись взаперти, мы столкнулись с самими собой

Esquire
Квантовое расширение черной дыры Крускала оказалось асимптотически корректным Квантовое расширение черной дыры Крускала оказалось асимптотически корректным

Квантовая теория является асимптотически корректной

N+1
Встречаюсь с женатым и не чувствую вины Встречаюсь с женатым и не чувствую вины

История читательницы о романе с женатым человеком с комментариями психолога

Psychologies
Генетики обнаружили полиморфизм тоновости языка Генетики обнаружили полиморфизм тоновости языка

С помощью этого гена можно определить, относится ли язык человека к тоновым

N+1
Сил моих больше нет! Сил моих больше нет!

Что делать, если дети доводят тебя до белого каления

Лиза
Заболеет ли доллар? Чем грозят вашим сбережениям деньги, «разбрасываемые с вертолета» в США Заболеет ли доллар? Чем грозят вашим сбережениям деньги, «разбрасываемые с вертолета» в США

Комплекс мер по стимулированию экономики США оценивается в $2 трлн долларов

Forbes
Открыть в приложении