Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не только шипы и колючки: 7 механизмов, с помощью которых растения защищаются от внешних угроз Не только шипы и колючки: 7 механизмов, с помощью которых растения защищаются от внешних угроз

Какие механизмы защиты мать-природа предусмотрела у представителей флоры

ТехИнсайдер
Кто такая пикми: разбираем феномен пикми-герл с психологами Кто такая пикми: разбираем феномен пикми-герл с психологами

Что стоит за пикми-поведением?

РБК
Как Мэй Хабиб заработала $285 млн на ИИ-агентах, способных заменить 90% работников Как Мэй Хабиб заработала $285 млн на ИИ-агентах, способных заменить 90% работников

Как Мэй Хабиб создает ПО на базе ИИ, которое берет на себя рутинные задачи

Forbes
У берегов Антарктиды нашли «странных» морских свинок, пауков» и бабочек У берегов Антарктиды нашли «странных» морских свинок, пауков» и бабочек

Глубины Антарктиды скрывают поразительные формы жизни

ТехИнсайдер
Борьба со старением: новые подходы и тренды Борьба со старением: новые подходы и тренды

Что сегодня предлагает от старения превентивная медицина?

РБК
Почему долгосрочные сбережения «не летят» Почему долгосрочные сбережения «не летят»

Почему у людей нет интереса к программе долгосрочных сбережений и ИИС-3

Монокль
Блеск и несчастья «Великого Гэтсби» Блеск и несчастья «Великого Гэтсби»

Краткая история главного американского произведения 1920‑х

Weekend
Взлетная полоса Взлетная полоса

Брутальный и динамичный интерьер для молодого человека

SALON-Interior
Василий Мищенко: «Табаков не отпустил меня сниматься к Михалкову» Василий Мищенко: «Табаков не отпустил меня сниматься к Михалкову»

Василию Мищенко сказали на экзаменах: «По-моему, это сумасшедший, надо брать!»

Коллекция. Караван историй
Пасту для ассирийских табличек для письма сделали из воска и аурипигмента Пасту для ассирийских табличек для письма сделали из воска и аурипигмента

Чем покрывали деревянные дощечки для письма в Древней Месопотамии?

N+1
Какую одежду с этикеткой «стирка запрещена» можно стирать дома: мнение экспертов Какую одежду с этикеткой «стирка запрещена» можно стирать дома: мнение экспертов

Какие вещи можно привести в порядок дома, а какую лучше доверить профессионалам

VOICE
Умер Зураб Церетели: вспоминаем 11 самых грандиозных и неоднозначных работ скульптора Умер Зураб Церетели: вспоминаем 11 самых грандиозных и неоднозначных работ скульптора

Самые яркие его шедевры художника-монументалиста Зураба Церетели

Maxim
Керосиновая история Керосиновая история

Жизнь в послевоенном социализме делится на «время керосина» и «время газа»

Знание – сила
Учеба без отрыва от работы Учеба без отрыва от работы

Выстроить систему обучения сотрудников можно и без корпоративного университета

Ведомости
Светлана Коркошко: «Одиночество — это моя природа» Светлана Коркошко: «Одиночество — это моя природа»

«Я долго не могла переступить порог моего любимого МХАТа после его раздела»

Коллекция. Караван историй
Блестящая партия Блестящая партия

Тина Канделаки — об интеллектуальных шоу и зрителях всех поколений

OK!
3 шага, которые позволят сменить работу без финансовых рисков и потерь 3 шага, которые позволят сменить работу без финансовых рисков и потерь

Решение сменить работу связано с финансовым риском. Как его не допустить?

Inc.
Когда медицинские практики прошлого у нас в крови… Когда медицинские практики прошлого у нас в крови…

На протяжении почти 2000 лет для лечения болезней использовалось кровопускание

Знание – сила
Я скоро стану мамой Я скоро стану мамой

Какие обследования и когда важно пройти будущим мамам?

Лиза
3 бизнес-ошибки основателя фастфуд-сети Mary Wong 3 бизнес-ошибки основателя фастфуд-сети Mary Wong

Основатель Mary Wong — о шишках, которые набил в процессе развития фастфуд-сети

Inc.
8 признаков, которые говорят о том, что парикмахер плохо тебя подстрижет 8 признаков, которые говорят о том, что парикмахер плохо тебя подстрижет

Красные флаги, указывающие на то, парикмахер сделает тебе плохую стрижку

VOICE
В абитуриенте ценят личность В абитуриенте ценят личность

Как увеличится роль индивидуальных достижений при поступлении в вузы

Ведомости
Жизнь на свободную тему Жизнь на свободную тему

Как вырастить ребенка уверенным, жизнерадостным и устойчивым?

Psychologies
Банки вкладывают в инклюзию Банки вкладывают в инклюзию

В Т-банке появилась поддержка только с глухими и слабослышащими сотрудниками

Ведомости
Стремительный разгон и быстрый взлет: самые короткие взлетно-посадочные полосы в мире Стремительный разгон и быстрый взлет: самые короткие взлетно-посадочные полосы в мире

Аэропорты, взлетно-посадочные полосы которых проверяют пилотов на прочность

ТехИнсайдер
Мария Мацель: «Теперь наконец я могу делать и что-то свое» Мария Мацель: «Теперь наконец я могу делать и что-то свое»

Актриса Мария Мацель — о том, как снимаются фильмы-сны

Ведомости
Терапия будущего Терапия будущего

Марк Бартон — про ИИ-психолога и инновации в сфере психологической помощи

Psychologies
Ученые говорят, что наши мышцы стареют не так быстро, как нам кажется Ученые говорят, что наши мышцы стареют не так быстро, как нам кажется

У пожилых людей мышечные повреждения после спортивных нагрузок не так серьезны

ТехИнсайдер
Беззубый театр. Беседа на спорные темы Беззубый театр. Беседа на спорные темы

Продолжение статьи худрука Марка Розовского о современном театре

Знание – сила
«У художника нет цели — только путь» «У художника нет цели — только путь»

Зорикто Доржиев о том, как искать себя в легендах и находить на Christie’s

Weekend
Открыть в приложении