Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Исследование показало, что социальное дистанцирование не защищает от инфекций Исследование показало, что социальное дистанцирование не защищает от инфекций

Социальное дистанцирование не защищает от инфекций. А что защищает?

ТехИнсайдер
Исследование показало, что подростки, которые рано ложатся спать, обладают более острым мозгом Исследование показало, что подростки, которые рано ложатся спать, обладают более острым мозгом

Подростки, которые ложатся спать раньше, как правило, обладают более острым умом

Inc.
Как увидеть угрозы безопасности при работе с ИИ? Ловите чек-лист Как увидеть угрозы безопасности при работе с ИИ? Ловите чек-лист

Чем опасны ИИ-модели для бизнеса и почему традиционная ИБ не справляется

Inc.
Ход слоном Ход слоном

Почему та или иная страна становится передовой, а потом вдруг отстающей?

ТехИнсайдер
Как нас обманывает Disney: чем на самом деле заканчиваются популярные детские сказки Как нас обманывает Disney: чем на самом деле заканчиваются популярные детские сказки

Почти у каждой сказки, которую вы читали в детстве, есть версия 18+...

ТехИнсайдер
Дом и сад Дом и сад

Вилла в городе садов Сучжоу

SALON-Interior
Мужчина мечты Мужчина мечты

Хочет ли Ярослав Могильников остаться в кино и как проходят его первые свидания

VOICE
Роскошь прочтения Роскошь прочтения

Что нового в фэшн-индустрии? Старомодное чтение

Grazia
Топливный фронт Топливный фронт

Как советская нефтяная промышленность приближала победу

Эксперт
Как научиться принимать комплименты Как научиться принимать комплименты

Почему бывает трудно принимать комплименты и как с этим справиться

Inc.
Язык и окружающая среда: почему у одних народов больше слов для обозначения любви, а у других – для снега Язык и окружающая среда: почему у одних народов больше слов для обозначения любви, а у других – для снега

Как окружающая среда влияет на словарный запас?

ТехИнсайдер
А как у них? А как у них?

6 рецептов пасхальных куличей из разных стран

Лиза
«Ночные кошмары: Нарушения сна и как мы с ними живем наяву» «Ночные кошмары: Нарушения сна и как мы с ними живем наяву»

Что науке известно о галлюцинациях, связанных со сном

N+1
Победители и побеждённые Победители и побеждённые

Противоречивый мир Англии: норманны властвовали землей, а саксы её возделывали

Дилетант
Если бабушка балует ребенка Если бабушка балует ребенка

Как тактично склонить старшее поколение на свою линию воспитания

Лиза
Детка, ты просто космос Детка, ты просто космос

Анна Завтур доказывает: не стоит видеть в ней только лирическую героиню

VOICE
Искоренить фальсификат Искоренить фальсификат

Методики проверки, испытаний, идентификации продукции нужно совершенствовать

Агроинвестор
Исследование обнаружило связь между финансами и здоровьем Исследование обнаружило связь между финансами и здоровьем

Психологи выяснили, что удовлетворенность финансами связана с лучшим здоровьем

Inc.
Амарант Амарант

Почему амарант — суперфуд и важнейшая пищевая культура XXI века

Здоровье
RF-лифтинг, эндосфера и душ Шарко: как быстро привести тело в порядок RF-лифтинг, эндосфера и душ Шарко: как быстро привести тело в порядок

Процедуры, которые помогут скорректировать фигуру в короткие сроки

Здоровье
8 советов стоматологов, как быстро и просто улучшить состояние зубов 8 советов стоматологов, как быстро и просто улучшить состояние зубов

Как поддерживать красоту и здоровье зубов

ТехИнсайдер
Бренд народного происхождения Бренд народного происхождения

Как в России развиваются художественные промыслы

Эксперт
Революция как массовый психоз? Революция как массовый психоз?

Учёный или шарлатан? Как разбирали труды Чижевского в 1940 году

Дилетант
Блеск и несчастья «Великого Гэтсби» Блеск и несчастья «Великого Гэтсби»

Краткая история главного американского произведения 1920‑х

Weekend
У берегов Антарктиды нашли «странных» морских свинок, пауков» и бабочек У берегов Антарктиды нашли «странных» морских свинок, пауков» и бабочек

Глубины Антарктиды скрывают поразительные формы жизни

ТехИнсайдер
Иностранцы на входе Иностранцы на входе

Как разрабатываются механизмы возвращения иностранного бизнеса в Россию

Ведомости
Прививка от аллергии АСИТ — как она работает? Прививка от аллергии АСИТ — как она работает?

Вместо того чтобы смягчать симптомы аллергии, можно устранить причину

СНОБ
«Мы можем подобрать рекламные механики для любого бизнеса» «Мы можем подобрать рекламные механики для любого бизнеса»

Дмитрий Константин о том, как создать эффективную рекламную платформу

Деньги
Кругосветка за 72 дня и критика тюремной системы: о чем писали первые журналистки Кругосветка за 72 дня и критика тюремной системы: о чем писали первые журналистки

Шесть женщин, изменивших журналистику

Forbes
Потрясно: что такое турбулентность и почему ее не надо бояться Потрясно: что такое турбулентность и почему ее не надо бояться

Рассказываем, что такое турбулентность и почему ее совершенно не стоит бояться

ТехИнсайдер
Открыть в приложении