Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Лики Вики Лики Вики

До съемки в нашем презренном журнале снизошла богиня «Инстаграма» Вики Одинцова

Maxim
Как разминируют минные поля: работа сапера Как разминируют минные поля: работа сапера

Как проходят тренировки одного из самых боеспособных соединений Российской армии

Популярная механика
10 мифов о здоровье 10 мифов о здоровье

Расстаемся со стереотипами!

Лиза
Гендерные стереотипы не повлияли на доверие к роботам Гендерные стереотипы не повлияли на доверие к роботам

Чтобы не поддерживать стереотипы, стоит создавать гендерно-нейтральных роботов

N+1
Правила жизни Андрея Тарковского Правила жизни Андрея Тарковского

Правила жизни советского режиссера и сценариста Андрея Тарковского

Esquire
6 неочевидных причин, снижающих мотивацию твоей команды (их нельзя игнорировать) 6 неочевидных причин, снижающих мотивацию твоей команды (их нельзя игнорировать)

Шесть не самых очевидных причин, которые демотивируют сотрудников.

Playboy
Вокруг Москвы за один день: 5 идеальных маршрутов для короткого путешествия за город Вокруг Москвы за один день: 5 идеальных маршрутов для короткого путешествия за город

Неожиданные маршруты для короткой однодневной вылазки за свежим воздухом

Forbes
Где и как познакомиться с мужчиной во время карантина Где и как познакомиться с мужчиной во время карантина

Пандемия — не повод отказываться от новых встреч и знакомств

Psychologies
Триумф аутсайдера: как пандемия сделала шахматы спортивным мейнстримом Триумф аутсайдера: как пандемия сделала шахматы спортивным мейнстримом

Шахматисты устроили два топ-турнира в онлайне, получив телеэфир

Forbes
10 самых опасных бактерий 10 самых опасных бактерий

Бактерии бывают разными - как полезными, так и смертельно опасными

Популярная механика
Корпоративное добро: зачем бизнесу нужна благотворительность Корпоративное добро: зачем бизнесу нужна благотворительность

Александра Бабкина о том, чем бизнес и НКО могут быть полезны друг другу

Forbes
Как и почему пьянствуют животные Как и почему пьянствуют животные

Поведение животных под воздействием алкоголя позволяет понять, почему пьют люди

Популярная механика
Нательный датчик научили определять уровень витамина C через пот Нательный датчик научили определять уровень витамина C через пот

Это позволяет отслеживать уровень витамина после приема лекарств или еды

N+1
Дыра в ВВП: чем грозит экономике гибель малого бизнеса в России Дыра в ВВП: чем грозит экономике гибель малого бизнеса в России

Уже сейчас можно оценить последствия кризиса для малого бизнеса и экономики

Forbes
Доктор едет, едет Доктор едет, едет

Два врача и программист построили цифровую платформу для ДМС

Forbes
Стать лучшей версией себя: 7 книг для саморазвития от вице-президента Whirpool Стать лучшей версией себя: 7 книг для саморазвития от вице-президента Whirpool

Книги, которые перевернут ваше представление о себе

Forbes
Рецепт счастья по-фински Рецепт счастья по-фински

В чем секрет финнов и какие факторы повышают удовлетворенность жизнью?

Psychologies
Где рождаются нейтрино: новое исследование Где рождаются нейтрино: новое исследование

Ученым удалось найти связь между космическими нейтрино и вспышками галактик

Популярная механика
Как помочь партнеру с социофобией? Как помочь партнеру с социофобией?

Социофобия — не просто застенчивость, а настоящее психическое расстройство

Psychologies
Дарья Мороз — новая икона стиля и секс-символ российского кино Дарья Мороз — новая икона стиля и секс-символ российского кино

Кто такая Дарья Мороз?

Cosmopolitan
Сеть поддельных клиентов и фальшивый сотрудник: WSJ разобрала обман инвесторов «китайского Starbucks» Luckin Coffee Сеть поддельных клиентов и фальшивый сотрудник: WSJ разобрала обман инвесторов «китайского Starbucks» Luckin Coffee

Конкурент Starbucks в Китае претендовал на звание технологической кофейни

VC.RU
Полководец во френче. Какие портреты северные корейцы обязаны вывешивать в домах Полководец во френче. Какие портреты северные корейцы обязаны вывешивать в домах

Отрывок из книги «К северу от 38-й параллели: Как живут в КНДР»

Forbes
Книги о музыке для изоляции Книги о музыке для изоляции

Пять хороших свежих книг о  музыке и музыкальной индустрии

GQ
«Пропусков нет у каждого второго». Как работает система «Карантин» «Пропусков нет у каждого второго». Как работает система «Карантин»

Что не так с новым приложением для ГИБДД, на которое потратили 27 млн рублей

РБК
Любовь на карантине: как не испортить отношения с партнером в самоизоляции Любовь на карантине: как не испортить отношения с партнером в самоизоляции

Постоянно быть рядом трудно, как бы вы друг друга ни любили

Cosmopolitan
Выхода нет: 4 самые неприступные тюрьмы мира Выхода нет: 4 самые неприступные тюрьмы мира

Тюрьмы супермаксимальной безопасности, из которых невозможно сбежать

Maxim
Сердце гребаного мира Сердце гребаного мира

Андрей Карташов о «Фее» Анны Меликян

Weekend
10 лучших триллеров на Netflix, которые стоит посмотреть прямо сейчас 10 лучших триллеров на Netflix, которые стоит посмотреть прямо сейчас

Триллеры, которые действительно заставят вас почувствовать напряжение

Esquire
Надежда Толоконникова: «В России человек любого пола должен уметь постоять за себя» Надежда Толоконникова: «В России человек любого пола должен уметь постоять за себя»

Участница Pussy Riot о новом сингле «Нож» и домашнем насилии

Maxim
Серебристая акация оказалась полезным инвазивным видом Серебристая акация оказалась полезным инвазивным видом

Древесные азотфиксаторы могут помочь в поглощении избыточного углекислого газа

N+1
Открыть в приложении