Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Мини-арсенал Мини-арсенал

Точнейшие миниатюрные копии стрелкового оружия, из которых можно и пострелять

Популярная механика
Бежать по первому писку или оставить проплакаться? Бежать по первому писку или оставить проплакаться?

Во всем работает правило золотой середины, в воспитании детей тоже

Psychologies
Соленую воду на Марсе посчитали непригодной для жизни Соленую воду на Марсе посчитали непригодной для жизни

Поверхность Марса и его недра не подходят для существования живых организмов

N+1
Космический мусор предложили побороть орбитальными налогами Космический мусор предложили побороть орбитальными налогами

Плата за вывод спутников в космос поможет контролировать космический мусор

N+1
10 внезапных фактов об изобретателях 10 внезапных фактов об изобретателях

Великие изобретатели были чертовски разносторонними личностями

Maxim
Разумную жизнь на двойниках Земли назвали редкостью Разумную жизнь на двойниках Земли назвали редкостью

На планетах, похожих на Землю, могут встречаться примитивные организмы

N+1
Манна небесная: российские дроны доставки еды Манна небесная: российские дроны доставки еды

Жители Ижевска могут заказывать еду, которая доставляется дронами

Популярная механика
Самые дорогие мужские вещи, проданные на аукционе Самые дорогие мужские вещи, проданные на аукционе

Неплохой получился бы гардероб, если бы все это вошло в одну коллекцию

GQ
Не проспать опасность: как всегда быть начеку? Не проспать опасность: как всегда быть начеку?

Нужна ли ситуативная готовность обычному человеку и может ли он ее освоить?

Популярная механика
Правила жизни Шер Правила жизни Шер

Правила жизни певицы и актрисы Шер

Esquire
Как англичане зарыли гениальное русское изобретение: история гирокара Шиловского Как англичане зарыли гениальное русское изобретение: история гирокара Шиловского

Взлеты и мытарства графа Петра Шиловского и его двухколесного гирокара

Maxim
Квантовый процессор просимулировал изомеризацию и вычислил энергии водородных цепочек Квантовый процессор просимулировал изомеризацию и вычислил энергии водородных цепочек

Алгоритм помог вычислить энергию основных состояний водородных цепочек

N+1
Американская мечта. Две родины Аллы Клюки Американская мечта. Две родины Аллы Клюки

После долгих лет, проведенных в США, актриса вернулась на родину

Cosmopolitan
Почему изоляция влияет на твое либидо: 7 советов, как его вернуть Почему изоляция влияет на твое либидо: 7 советов, как его вернуть

Разбираемся, как именно пандемия влияет на либидо, и что с этим делать

Playboy
Древнее мексиканское озеро стало ловушкой для 60 мамонтов Древнее мексиканское озеро стало ловушкой для 60 мамонтов

Эти мамонты попались в грязевые ловушки и погибли

N+1
Треска с петрушкой Треска с петрушкой

Треска — твердыня в мире, где все только рушилось, расползалось, гнило и горело

Weekend
Еще 10 тайных сюрпризов в фильмах, которые ты мог не заметить Еще 10 тайных сюрпризов в фильмах, которые ты мог не заметить

Фильмы — старые, но пасхалки в них все еще смотрятся свежо

Maxim
Апокалипсис Дрездена: дуэли «ковровых бомбардировок» Апокалипсис Дрездена: дуэли «ковровых бомбардировок»

Одна из самых спорных и противоречивых военных операций Второй мировой

Популярная механика
Мужчины испокон веков ходили на каблуках Мужчины испокон веков ходили на каблуках

Вы тоже сможете ходить на каблуках – главное, правильно начать

GQ
Моя психотерапевтка беременна: можно ли продолжать терапию? Моя психотерапевтка беременна: можно ли продолжать терапию?

Беременность психологини всегда вызывает ряд этических вопросов

Psychologies
Создан материал, способный быстро стать прозрачным в ИК-спектре Создан материал, способный быстро стать прозрачным в ИК-спектре

Открытие ученых может повысить надежность сложных оптических устройств

Популярная механика
МинФин МинФин

Как живет самая молодая в мире женщина-премьер

Tatler
Нехватка насекомых снизила успех размножения городских синиц Нехватка насекомых снизила успех размножения городских синиц

Городские синицы справляются с выведением потомства хуже лесных сородичей

N+1
Валерий Борзов – Усейн Болт из Советского Союза Валерий Борзов – Усейн Болт из Советского Союза

Его называют последним чистым спринтером в истории

GQ
Топ-5 пар летней обуви, которая никогда не выйдет из моды Топ-5 пар летней обуви, которая никогда не выйдет из моды

Выглядеть стильно можно независимо от постоянно меняющихся трендов

Cosmopolitan
Игра Streets of Rage 4 могла стать чудовищным провалом Игра Streets of Rage 4 могла стать чудовищным провалом

Streets of Rage 4 – культурный феноменом и достижение индустрии видеоигр

GQ
«Он ударил меня кулаком в живот»: Паршута и другие жертвы насилия среди звезд «Он ударил меня кулаком в живот»: Паршута и другие жертвы насилия среди звезд

Звезды, которые нашли в себе силы выйти из абьюзивных отношений

Cosmopolitan
Электрон в атоме гелия заменили на пион Электрон в атоме гелия заменили на пион

Физики впервые экспериментально подтвердили экзотический метастабильный атом

N+1
«Кодекс общежития»: как основатели Skyeng не сломались на старте «Кодекс общежития»: как основатели Skyeng не сломались на старте

Компания Skyeng смогла преодолеть несколько кризисов и не развалиться

Forbes
Пространственный анализ австралийских пожаров указал на недостатки природоохранной политики Пространственный анализ австралийских пожаров указал на недостатки природоохранной политики

Производство древесины ставит под угрозу миллионы гектаров земель на континенте

N+1
Открыть в приложении