Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Реальное право на искусственное сознание Реальное право на искусственное сознание

Почему цифровая среда так плохо поддается правовой регуляции

Монокль
Территория детства Территория детства

7 особенностей дизайна, которые точно понравятся твоему ребенку

Лиза
Ценный попутчик Ценный попутчик

Как путешествовать с собакой без стресса

Лиза
Почему галактики закручиваются в спирали: ученые изучили механизмы формирования звездных скоплений Почему галактики закручиваются в спирали: ученые изучили механизмы формирования звездных скоплений

Какие модели образования спиралевидных галактик выделяют учены?

ТехИнсайдер
Остановить внутреннего паникера Остановить внутреннего паникера

Как утихомирить внутреннего тревожного паникера: советы от психотерапевтов

Psychologies
Минеральные льготы: как работает господдержка производителей удобрений Минеральные льготы: как работает господдержка производителей удобрений

Нуждаются ли компании отрасли удобрений в дополнительной поддержке?

Forbes
Какие были парфюмы в Древней Греции? Узнайте интересные факты! Какие были парфюмы в Древней Греции? Узнайте интересные факты!

Мир ароматов в Древней Греции был куда богаче, чем может показаться

ТехИнсайдер
Впервые в лаборатории воссоздана нервная цепь человеческой боли Впервые в лаборатории воссоздана нервная цепь человеческой боли

Ученые воспроизвели важный нервный путь, из-за которого человек чувствует боль

ТехИнсайдер
Астрономы впервые достоверно нашли экзопланету с кратной полярной орбитой Астрономы впервые достоверно нашли экзопланету с кратной полярной орбитой

Ученые впервые подтвердили существование экзопланеты с кратной полярной орбитой

N+1
За 10 лет арктические дафнии не смогли приспособиться к потеплению За 10 лет арктические дафнии не смогли приспособиться к потеплению

Почему особи бесполых дафний плохо переносят потепление

N+1
Личное пространство Личное пространство

Респектабельный минимализм с авторскими решениями и иконами дизайна

SALON-Interior
Зарплатно-гендерный вопрос Зарплатно-гендерный вопрос

Удовлетворенность размером зарплаты среди мужчин и женщин практически сравнялась

Ведомости
Секаторы на пенсию: топ-5 аккумуляторных кусторезов 2025 года Секаторы на пенсию: топ-5 аккумуляторных кусторезов 2025 года

Как выбрать аккумуляторный кусторез для сада?

CHIP
Войны сыновей Войны сыновей

Как потомки Вильгельма I делили его наследие

Дилетант
Робопчелу научили садиться по-комарьи Робопчелу научили садиться по-комарьи

Инженеры разработали шасси для миниатюрного орнитоптера RoboBee

N+1
Москва и коллекционеры Москва и коллекционеры

Москва в последние годы закрепила за собой статус главной площадки арт-рынка

Ведомости
Возвращение гребного колеса Возвращение гребного колеса

Первые упоминания о гребном колесе относятся еще к древнейшим временам...

Наука и техника
Как научиться принимать комплименты Как научиться принимать комплименты

Почему бывает трудно принимать комплименты и как с этим справиться

Inc.
Почему женщины выбирают мужчин с криминальным прошлым: объясняет психолог Почему женщины выбирают мужчин с криминальным прошлым: объясняет психолог

По каким причинам девушки выбирают парней с криминальным прошлым?

VOICE
Культура сбережений: зачем откладывать на завтра то, что можно потратить сегодня? Культура сбережений: зачем откладывать на завтра то, что можно потратить сегодня?

Зачем каждому гражданину нужно выработать у себя привычку делать сбережения?

Наука и техника
Весна в облигациях Весна в облигациях

Бизнес не намерен снижать программы по капитальным инвестициям

Ведомости
Русско-американские отношения в XIX веке. Часть 2 Русско-американские отношения в XIX веке. Часть 2

Какими были отношения США и России накануне войны между Севером и Югом

Наука и техника
Терапия CRISPR/Cas помогла снизить «плохой» холестерин при семейной гиперхолестеринемии Терапия CRISPR/Cas помогла снизить «плохой» холестерин при семейной гиперхолестеринемии

Как помогла терапия CRISPR/Cas при семейной гиперхолестеринемии

N+1
Ботаники описали новый вид паразитирующих на грибах «волшебных фонариков» с Малайского полуострова Ботаники описали новый вид паразитирующих на грибах «волшебных фонариков» с Малайского полуострова

Как на востоке Малайского полуострова новый вид тисмий

N+1
Своей иранской тропой Своей иранской тропой

Современный Иран надеется сохранить государство и суверенитет

Монокль
Миниатюрный орнитоптер стал одноногим прыгуном Миниатюрный орнитоптер стал одноногим прыгуном

Как инженеры создали робота-прыгуна массой меньше грамма

N+1
Полевой роман Полевой роман

1943 г.: лыжные гонки с гранатами и футбольный матч в освобожденном Сталинграде

Ведомости
Ученые говорят, что наши мышцы стареют не так быстро, как нам кажется Ученые говорят, что наши мышцы стареют не так быстро, как нам кажется

У пожилых людей мышечные повреждения после спортивных нагрузок не так серьезны

ТехИнсайдер
Мы идем своим путем Мы идем своим путем

Русская внешняя политика как культурное явление

Эксперт
Ход слоном Ход слоном

Почему та или иная страна становится передовой, а потом вдруг отстающей?

ТехИнсайдер
Открыть в приложении