Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Поля морей Поля морей

Новые технологии сельского хозяйства: фермы в океане

Популярная механика
Человек-будильник и еще 4 необычные ретрофотографии Человек-будильник и еще 4 необычные ретрофотографии

Хорошо, что человечество изобрело не только фото, но и буквы

Maxim
Ученые уверены: ты не имеешь никакого отношения к решениям, которые принимаешь Ученые уверены: ты не имеешь никакого отношения к решениям, которые принимаешь

Оказывается, человек почти не пользуется логикой и способностью к анализу

Maxim
Бухгалтерия чувств Бухгалтерия чувств

Ксения Рождественская о документальном фильме про Джеффри Эпштейна

Weekend
Павел Дуров пошел на уступки инвесторам в криптовалюту Telegram Павел Дуров пошел на уступки инвесторам в криптовалюту Telegram

Павел Дуров согласился на уступку покупателям криптовалюты Gram

Forbes
«Маячки», по которым манипуляторы вычисляют жертв «Маячки», по которым манипуляторы вычисляют жертв

Чем опасны личностные проблемы и как не дать манипулятору ими воспользоваться?

Psychologies
Настоящая миссия компании: как она укрепляет бизнес и как сформулировать свою Настоящая миссия компании: как она укрепляет бизнес и как сформулировать свою

Способ, с помощью которого можно создать миссию для своей компании

VC.RU
Время есть: чем планируют питаться люди после конца света Время есть: чем планируют питаться люди после конца света

Чем будут питаться выжившие американцы в Армагеддоне?

Esquire
Торжество воды Торжество воды

Петергоф называют столицей фонтанов. Их здесь больше 150!

Лиза
Ким Шрёдингера. Почему важна судьба лидера Северной Кореи Ким Шрёдингера. Почему важна судьба лидера Северной Кореи

Кому действительно важна судьба лидера Северной Кореи

Forbes
Без контакта Без контакта

Что нужно знать о бесконтактной доставке?

Лиза
Топ-5 пар летней обуви, которая никогда не выйдет из моды Топ-5 пар летней обуви, которая никогда не выйдет из моды

Выглядеть стильно можно независимо от постоянно меняющихся трендов

Cosmopolitan
Первый советский хэтчбек — история «Иж-Комби» Первый советский хэтчбек — история «Иж-Комби»

За десять лет до «восьмерки»

Maxim
Юлия Княжанская: Как меняется онлайн- и офлайн-образование во время пандемии Юлия Княжанская: Как меняется онлайн- и офлайн-образование во время пандемии

Как правильно учиться в домашних условиях и не потеряться среди множества курсов

СНОБ
Комиссар молодежной биеннале — о горизонтальных связях и свободе от рамок Комиссар молодежной биеннале — о горизонтальных связях и свободе от рамок

Алексей Новоселов — о том, не боятся ли художники свободы

РБК
Твой личный шедевр Твой личный шедевр

Микротатуировки: за и против

Cosmopolitan
Функциональные связи гиппокампа предсказали субъективный стресс Функциональные связи гиппокампа предсказали субъективный стресс

Гиппокамп для этого остался ключевым участком

N+1
«У русских отличное чувство юмора!» «У русских отличное чувство юмора!»

Фелисе Янкелль — о карантине, материнстве и русских

OK!
От наркомана до Железного человека: удивительная жизнь Роберта Дауни-младшего От наркомана до Железного человека: удивительная жизнь Роберта Дауни-младшего

Жизнь Роберта Дауни-младшего не назвать простой и благополучной

Cosmopolitan
Крылья победы: где купить военный самолёт времён ВОВ Крылья победы: где купить военный самолёт времён ВОВ

В предвоенные и военные годы в СССР было выпущено 110 000 военных самолетов

Популярная механика
Колоссальная неопределенность: от чего зависит курс рубля и что с ним будет к концу года Колоссальная неопределенность: от чего зависит курс рубля и что с ним будет к концу года

От чего зависят валютные курсы, надолго ли доллар останется главной валютой мира

Forbes
Николай Каретников: Темы с вариациями Николай Каретников: Темы с вариациями

Фрагмент книги Николая Каретникова

СНОБ
Гендерные стереотипы не повлияли на доверие к роботам Гендерные стереотипы не повлияли на доверие к роботам

Чтобы не поддерживать стереотипы, стоит создавать гендерно-нейтральных роботов

N+1
Что делать, если тревога мешает сосредоточиться Что делать, если тревога мешает сосредоточиться

Как вернуться в настоящее, перезагрузиться и настроиться на работу?

Psychologies
5 главных вопросов о первой пилотируемой миссии SpaceX 5 главных вопросов о первой пилотируемой миссии SpaceX

США вот-вот запустят астронавтов со своей территории

Популярная механика
Тагишский метеорит оказался щелочным Тагишский метеорит оказался щелочным

Канадские геохимики проанализировали фрагменты Тагишского метеорита

N+1
Вышел сериал «Сквозь снег» — новая адаптация триллера Пона Джун Хо. Увы, до оригинала ему очень далеко Вышел сериал «Сквозь снег» — новая адаптация триллера Пона Джун Хо. Увы, до оригинала ему очень далеко

Сериал «Сквозь снег» — 10-серийный ремейк одноименного триллера Пона Джун Хо

Esquire
«Он ударил меня кулаком в живот»: Паршута и другие жертвы насилия среди звезд «Он ударил меня кулаком в живот»: Паршута и другие жертвы насилия среди звезд

Звезды, которые нашли в себе силы выйти из абьюзивных отношений

Cosmopolitan
7 самых обязательных фильмов с Клинтом Иствудом 7 самых обязательных фильмов с Клинтом Иствудом

31 мая любого года мы все отпразднуем день рождения Клинт Иствуда

Maxim
Как Северная Корея и Южная Корея пошли по разным дорожкам Как Северная Корея и Южная Корея пошли по разным дорожкам

Не было в мире более яркого геополитического эксперимента, чем разделение Кореи

Maxim
Открыть в приложении