Как большие языковые модели формируют представления о мыслях других людей

ТехИнсайдерHi-Tech

ИИ может поставить себя на место другого, но пока слишком дорогой ценой

Ученые из Университета Майами показали, как большие языковые модели формируют представления о мыслях других людей. Это — способность, известная как теория разума. Исследователи обнаружили, что для социальных рассуждений нейросети используют специализированный набор внутренних связей между словами

Владимир Губайловский

e3fb43bf409ab1a5b678a78cc64cd455_ce_1656x1104x0x0.jpg
Мы видим мир по-разному. Unsplash

Классический тест на теорию разума — задача о «ложном убеждении». Ребенку показывают сценку: персонаж прячет шоколадку в коробку и уходит, после чего другой персонаж перекладывает ее в ящик. Когда первый персонаж возвращается, ребенка спрашивают: где он будет искать шоколадку? Дети младше четырех лет обычно отвечают «в ящике», потому что они знают, где лежит шоколадка. Дети постарше понимают, что персонаж не знает о том, что шоколадку перепрятали и будет искать в коробке. Они уже могут поставить себя на место другого человека.

Теория разума — это способность понимать, что другие люди имеют собственные убеждения, желания и знания, отличные от наших. Человек развивает эту когнитивную функцию примерно к четырем годам, и мозг справляется с такими задачами за секунды, задействуя лишь небольшую группу нейронов. Большие языковые модели работают иначе: независимо от сложности вопроса они активируют практически всю свою нейронную сеть, что делает их крайне энергозатратными даже для простейших

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Открыть в приложении