В каких моделях мира искусственный интеллект учится познавать действительность

РБКHi-Tech

Миниатюрная версия реальности

В каких моделях мира искусственный интеллект учится познавать действительность

Автор: Александр Рыжков, руководитель R&D отдела «Авито»

Фото: пресс-служба «Авито»

Искусственный интеллект пока не умеет думать, как человек. Но модели мира могут это изменить — и такой прорыв ожидают исследователи-визионеры. Разбираемся, когда может случиться фундаментальный сдвиг в том, как машины понимают реальность.

Видео, которые сегодня генерируют нейросети, часто выглядят неестественными. Кошка сбрасывает чашку со стола — и та почему-то летит вверх. Или животное может спокойно пройти сквозь столешницу. Все дело в том, что современные модели генеративного ИИ, которые обучались на всех знаниях мира, пока не понимают элементарных законов физики.

У каждого человека есть своя модель мира в голове. Мы знаем, что если уронить чашку, она разобьется, а если толкнуть дверь, она откроется. Эти сценарии проигрываются мысленно — как будто внутри нас есть маленький симулятор реальности.

Сейчас гиганты вроде OpenAI и Google DeepMind пытаются создать такие системы внутри нейросетей. Представьте модель мира как игрушечный глобус внутри компьютера — миниатюрную версию реальности. ИИ сможет «покрутить» этот глобус, проверить разные сценарии и только потом действовать в настоящем мире. Ведущие исследователи-визионеры сходятся в одном: без моделей мира не создать по-настоящему умных систем ИИ. И за этим термином скрывается, возможно, самый важный прорыв в искусственном интеллекте со времен появления LLM — больших языковых моделей.

От философии к железу

Идею модели мира сформулировал шотландский психолог Кеннет Крейк в 1943 году — за 13 лет до появления термина «искусственный интеллект». Если организм носит в голове «маленькую копию» внешнего мира, писал Крейк, то он может проигрывать разные сценарии, выбирать лучший, действуя при этом безопасно для себя.

В конце 1960-х в Массачусетском технологическом институте (MIT) создали программу SHRDLU — один из первых экспериментов с моделями мира. Ее название произошло от набора букв в столбце клавиатуры линотипа — типографской печатной машины, которая отливала готовые строки текста из горячего металла, вместо того чтобы складывать их из отдельных букв. Бессмысленное «слово» SHRDLU наборщики использовали для обозначения ошибочных строк, что-то вроде ввода QWERTY с клавиатуры современных компьютеров.

Программа работала с виртуальным миром из цветных блоков: кубики, пирамидки, коробки. Пользователь мог давать команды на обычном языке («положи красный блок на синий кубик») или задавать вопросы («может ли пирамидка удержать кубик?»). SHRDLU понимала физические свойства объектов, планировала последовательность действий, отвечала осмысленно и могла передвигать фигуры. Программа произвела фурор: казалось, что машины скоро будут понимать все.

Но проект остался лабораторным экспериментом. Система была основана на тысячах вручную прописанных инструкций для блоков. Попытки перенести подход на реальный мир провалились: правил требовалось слишком много, они противоречили друг другу, и все рассыпалось.

К концу 1980-х разочарование было таким сильным, что пионер робототехники Родни Брукс из MIT выдвинул радикальную идею: вообще отказаться от построения моделей мира. «Лучшая модель мира — это сам мир», — писал он. Незачем строить внутренний симулятор, если робот может просто действовать в реальной среде и реагировать на то, что видит. Его роботы-насекомые обходились без сложных представлений о мире и неплохо справлялись с простыми задачами. На два десятилетия идея моделей мира была отодвинута на второй план.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Открыть в приложении