Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Построение в каре Построение в каре

Юлия Акимова оформила интерьер своей квартиры, вдохновляясь Францией

AD
Попасть в историю: 6 новых исторических романов, которые стоит прочитать Попасть в историю: 6 новых исторических романов, которые стоит прочитать

Несколько отличных исторических романов

Esquire
Не проходите мимо Не проходите мимо

Всегда ли оправдана политика невмешательства?

Лиза
Колоссальная неопределенность: от чего зависит курс рубля и что с ним будет к концу года Колоссальная неопределенность: от чего зависит курс рубля и что с ним будет к концу года

От чего зависят валютные курсы, надолго ли доллар останется главной валютой мира

Forbes
Нервы на пределе: почему российские власти рассердились на заметку о рейтинге Путина Нервы на пределе: почему российские власти рассердились на заметку о рейтинге Путина

Связан ли всплеск эмоций посольства с голосованием о поправках в Конституцию?

Forbes
Месть нерождённых и спасение Руси: чем живут мужчины, выступающие против абортов Месть нерождённых и спасение Руси: чем живут мужчины, выступающие против абортов

Идеи, продвигаемые мужчинами, которые хотят за женщин решать вопрос материнства

Cosmopolitan
Как включить самообладание: правило 90 секунд Как включить самообладание: правило 90 секунд

Можем ли мы выбирать, как реагировать на раздражающие обстоятельства?

Psychologies
Как отличить кэгэбешную «Волгу» от обычной Как отличить кэгэбешную «Волгу» от обычной

Пособие для иностранного шпиона в четырех шагах

Maxim
Время есть: чем планируют питаться люди после конца света Время есть: чем планируют питаться люди после конца света

Чем будут питаться выжившие американцы в Армагеддоне?

Esquire
Тогда и сейчас: как выглядят самые крепкие голливудские пары Тогда и сейчас: как выглядят самые крепкие голливудские пары

Они повстречали друг друга в молодости и с тех пор не расставались

Cosmopolitan
Следовать за мечтой Следовать за мечтой

Наталья и Мурад Османн — не только красивая семейная пара, но и бренд

OK!
Глазами иностранца: чем руководствуются русские при принятии решений Глазами иностранца: чем руководствуются русские при принятии решений

Чем руководствуются иностранцы и русские при принятии решений

Forbes
Кровь стынет в жилах! 7 сериалов для тех, кому понравился «Колл-центр» Кровь стынет в жилах! 7 сериалов для тех, кому понравился «Колл-центр»

Что еще делать на карантине, как не смотреть сериалы

Cosmopolitan
Советы бывалого. Мореплаватель Рид Стоу о том, как прожить 1152 дня в полной изоляции и полюбить одиночество Советы бывалого. Мореплаватель Рид Стоу о том, как прожить 1152 дня в полной изоляции и полюбить одиночество

Как мореплаватель Рид Стоу проводил изоляцию в океане и что для него это значило

Forbes
Окончательная победа США: как Россия безнадежно отстала от Америки в космической гонке Окончательная победа США: как Россия безнадежно отстала от Америки в космической гонке

Запуск Crew Dragon знаменует начало века Pax Americana в космосе

Forbes
Британец воссоздал в виртуальной реальности любимый бар. Он изучил основы 3D с нуля Британец воссоздал в виртуальной реальности любимый бар. Он изучил основы 3D с нуля

Тристан Кросс воссоздал в виртуальной реальности свой любимый паб

Esquire
Менеджеры паролей: что это такое и чем полезны? Менеджеры паролей: что это такое и чем полезны?

Надоело запоминать пароли к разным ресурсам?

CHIP
Глубоким слоям океана пообещали заметные последствия от изменения климата Глубоким слоям океана пообещали заметные последствия от изменения климата

Как глобальное потепление может повлиять на разные слои океана

N+1
Комиссар молодежной биеннале — о горизонтальных связях и свободе от рамок Комиссар молодежной биеннале — о горизонтальных связях и свободе от рамок

Алексей Новоселов — о том, не боятся ли художники свободы

РБК
Пять звезд в чистом поле: как в России построили первый с советских времен аэропорт Пять звезд в чистом поле: как в России построили первый с советских времен аэропорт

Как появился Ростовский Платов и почему не все авиакомпании могут здесь садиться

Forbes
Итальянские каникулы Итальянские каникулы

Квартира, оформленная с уважением к итальянским традициям

AD
Хватит ныть! Хватит ныть!

Вытри слезы – они только мешают справляться с трудностями!

Лиза
Hyundai Tucson — 2021: каким будет новый кроссовер Hyundai Tucson — 2021: каким будет новый кроссовер

Новые подробности о кроссовере Hyundai Tucson следующего поколения

РБК
Рыбий жир: доказанная польза для мужчин и рекомендации по употреблению Рыбий жир: доказанная польза для мужчин и рекомендации по употреблению

Пора «подсесть» на рыбий жир?

Playboy
Комплекс упражнений для мам с малышом до 3-х лет в домашних условиях Комплекс упражнений для мам с малышом до 3-х лет в домашних условиях

Оптимальные упражнения для совместных фитнес-тренировок с маленьким ребенком

Мама и малыш
Вацлав Гавел. Жизнь в истории Вацлав Гавел. Жизнь в истории

Отрывок из книги «Вацлав Гавел: Жизнь в истории» Ивана Беляева

СНОБ
Что в имени тебе моём? 10 звёздных фамилий, которые не являются псевдонимами Что в имени тебе моём? 10 звёздных фамилий, которые не являются псевдонимами

Многие не верят, что имена этих знаменитостей настоящие

Cosmopolitan
Улучшающий запоминание шрифт не улучшил запоминание Улучшающий запоминание шрифт не улучшил запоминание

Sans Forgetica нужно переименовать в Sans Remembica (ба-дум-тсс)

N+1
«Простая человеческая слабость может сделать больше, чем идеальный имидж» «Простая человеческая слабость может сделать больше, чем идеальный имидж»

Почему возможность показать свою уязвимость — путь сильных и успешных людей

Psychologies
Искусство в моде или модное искусство: тренд на арт-фэшн коллаборации Искусство в моде или модное искусство: тренд на арт-фэшн коллаборации

Мода и искусство неразрывны, они всегда идут рука об руку

Cosmopolitan
Открыть в приложении