Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Агнец и виноград Агнец и виноград

Мясо и вино соединились в традиционном праздничном блюде – чакапули

Вокруг света
Трихолог — о способах борьбы с выпадением волос Трихолог — о способах борьбы с выпадением волос

Как справиться с облысением?

РБК
Сон или зубрежка всю ночь? Ответ подсказали мозговые волны Сон или зубрежка всю ночь? Ответ подсказали мозговые волны

Научные доказательства того, что сон очень важен в процессе запоминания

Популярная механика
Олень, иди за мной Олень, иди за мной

Ксения Рождественская о «Пожаре» Дэвида Линча

Weekend
10 антитрендовых дизайнерских решений, которые мы всё равно любим 10 антитрендовых дизайнерских решений, которые мы всё равно любим

В дизайне интерьеров тоже есть тренды и антитренды

Cosmopolitan
Избавиться от слов-паразитов и говорить эффектно. Как? Избавиться от слов-паразитов и говорить эффектно. Как?

Слова паразиты засоряют речь, мешают красиво выражать мысли и портят впечатление

Psychologies
Не только Мэрилин Монро: еще шесть шикарных блондинок 1950-х Не только Мэрилин Монро: еще шесть шикарных блондинок 1950-х

Никогда еще ностальгия не была такой волнующей

Maxim
«Лимассолград»: FT рассказала, почему ЕС начал беспокоиться из-за русских на Кипре «Лимассолград»: FT рассказала, почему ЕС начал беспокоиться из-за русских на Кипре

Как выходцы из СССР повлияли на Кипр, почему это заставляет Брюссель волноваться

Forbes
Ёлка, Юлия Хлынина, Владимир Яглыч, Алёна Бабенко и другие артисты прочитали рассказы Михаила Зощенко Ёлка, Юлия Хлынина, Владимир Яглыч, Алёна Бабенко и другие артисты прочитали рассказы Михаила Зощенко

Рассказ Михаила Зощенко в онлайн-проекте «Читай дома»

OK!
Близнецы Джудит и Джойс. Сестринская любовь, преодолевающая любые преграды Близнецы Джудит и Джойс. Сестринская любовь, преодолевающая любые преграды

Художница Джудит Скотт прошла путь от отчаявшейся женщины до признанного гения

Cosmopolitan
Где одеваются современные европейские монархи Где одеваются современные европейские монархи

В каких рубашках ходит принц Чарльз, и у кого заказывает костюмы король Филипп

GQ

Армия Кравченко должна была стать главной ударной силой в наступлении на Вену

Популярная механика
Начать кризис с запасом в $1,7 млрд, но почти разориться через месяц: почему бренд Gap может не пережить пандемию Начать кризис с запасом в $1,7 млрд, но почти разориться через месяц: почему бренд Gap может не пережить пандемию

Магазины простаивают, в онлайне тоже не покупают, компания не платит за аренду

VC.RU
13 спорных сцен из фильмов: что возможно, а что выдумка 13 спорных сцен из фильмов: что возможно, а что выдумка

Можно ли провести бриллианты в гипсе? А распилить кого-нибудь бензопилой?

Maxim
Они не железные! Звезды, которых карантин довел до нервного срыва Они не железные! Звезды, которых карантин довел до нервного срыва

Рассказываем, у кого из знаменитостей на карантине начали сдавать нервы

Cosmopolitan
Что в имени тебе моём? 10 звёздных фамилий, которые не являются псевдонимами Что в имени тебе моём? 10 звёздных фамилий, которые не являются псевдонимами

Многие не верят, что имена этих знаменитостей настоящие

Cosmopolitan
«Я заперлась в туалете, и тут раздался звук топора» «Я заперлась в туалете, и тут раздался звук топора»

Боитесь подать на развод, потому что уверены — вы не заслуживаете ничего лучше?

Psychologies
Технологии, 3D-принтер, магия: почему через несколько лет каждый сможет обходиться без магазинов Технологии, 3D-принтер, магия: почему через несколько лет каждый сможет обходиться без магазинов

3D-принтер из фантазий фанатов научпопа превратился в реальность ретейла

Esquire
Virgin Orbit впервые запустила ракету-носитель LauncherOne с самолета Virgin Orbit впервые запустила ракету-носитель LauncherOne с самолета

Компания Virgin Orbit впервые запустила ракету-носитель LauncherOne

N+1
Манна небесная: российские дроны доставки еды Манна небесная: российские дроны доставки еды

Жители Ижевска могут заказывать еду, которая доставляется дронами

Популярная механика
Драгоценное время Драгоценное время

Мы вспомнили самые важные кинособытия минувших лет

Grazia
Кавер-дуэт Queens: о стабильно «взрывных» песнях на любых корпоративах и раскрепощенных бюджетниках Кавер-дуэт Queens: о стабильно «взрывных» песнях на любых корпоративах и раскрепощенных бюджетниках

Интервью с солистками @girlsband.ru Татьяной и Анастасией

Playboy
Добавить света, зелени и красоты: как быстро сделать дом уютным Добавить света, зелени и красоты: как быстро сделать дом уютным

Как можно быстро и без больших вложений обновить ваше жилье

Forbes
Как менеджер паролей может предотвратить утечку информации Как менеджер паролей может предотвратить утечку информации

Всего один пароль - и не надо ломать голову над доступом к разным аккаунтам

CHIP
Анастасия Булгакова: «Главная задача управляющего — сделать так, чтобы всем было легко работать» Анастасия Булгакова: «Главная задача управляющего — сделать так, чтобы всем было легко работать»

Анастасия Булгакова — о процессах управления в ресторане

Bones
Играет на равных Играет на равных

Кейт Бланшетт о том, как «Миссис Америка» может помочь избежать ошибок прошлого

Grazia
Рождение таблетки. Как четверо энтузиаcтов совершили революцию в контрацепции Рождение таблетки. Как четверо энтузиаcтов совершили революцию в контрацепции

Отрывок из книги «Рождение таблетки» о невероятном социальном прорыве XX века

Forbes
Господин Плохие новости: как жил и работал Олден Уитмен, который десятилетиями писал некрологи для The New York Times Господин Плохие новости: как жил и работал Олден Уитмен, который десятилетиями писал некрологи для The New York Times

Каким был мастер составления некрологов Олден Уитмен?

Esquire
«Стартаперы — люди с нездоровой психикой»: главный герой фильма Юрия Дудя — о жизни в Кремниевой долине «Стартаперы — люди с нездоровой психикой»: главный герой фильма Юрия Дудя — о жизни в Кремниевой долине

Николай Давыдов стал одним из основных героев фильма Юрия Дудя

Forbes
Как продлить отношения на много лет? Полезное мнение специалиста Как продлить отношения на много лет? Полезное мнение специалиста

Социолог Пеппер Шварц о том, как выстроить хорошие отношения с партнером

Cosmopolitan
Открыть в приложении