Крохотная нейросеть обошла гигантов в решении логических задач

Исследовательница из Samsung AI Lab в Монреале Алексия Жоликёр-Мартино разработала компактную модель искусственного интеллекта, которая превзошла некоторые из лучших больших языковых моделей в тесте на абстрактное мышление, используя в 10 000 раз меньше ресурсов.

Владимир Губайловский

Небольшая рекурсивная модель превзошла крупные языковые модели в решении логических головоломок, несмотря на то, что она была обучена на гораздо меньшем наборе данных. Getty

Что такое тест ARC-AGI. Тест Abstract and Reasoning Corpus был создан специально для оценки способности машин к обобщению — главному признаку интеллекта. В отличие от традиционных тестов, где модели могут преуспеть за счет запоминания, ARC-AGI требует находить закономерности в визуальных головоломках на основе минимального числа примеров. Каждая задача представляет собой уникальную логическую головоломку с сеткой цветных клеток, где нужно понять правило преобразования и применить его к новому случаю — подобно тому, как человек решает IQ-тесты.

Модель под названием Tiny Recursive Model (TRM) показала впечатляющие результаты в тесте ARC-AGI — наборе визуальных логических головоломок, разработанном для оценки общего интеллекта машин. При всего 7 миллионах параметров (по сравнению с миллиардами у больших языковых моделей) она правильно решает 40% задач базового теста и 6,3% более сложной версии ARC-AGI-2, опережая такие модели как o4-mini от OpenAI.