Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Холсты за миллионы долларов: самые дорогие картины отечественных художников Холсты за миллионы долларов: самые дорогие картины отечественных художников

О самых дорогих картинах, вышедших из под кистей российских мэтров живописи

ТехИнсайдер
Почему от вина болит голова: рассказывает невролог Почему от вина болит голова: рассказывает невролог

Почему от белых вин голова болит реже, чем от красных?

СНОБ
5 неожиданных технологий, которые изменили 3D-графику 5 неожиданных технологий, которые изменили 3D-графику

Какие технологии стояли у истоков современной 3D-графики

ТехИнсайдер
Куда исчезли зеркала на крыльях автомобилей: вас давно мучает этот вопрос, но спросить было не у кого Куда исчезли зеркала на крыльях автомобилей: вас давно мучает этот вопрос, но спросить было не у кого

Зачем с кузовов автомобилей убрали мини зеркала

ТехИнсайдер
Ученые предсказали точную дату конца Вселенной— и он случится раньше, чем предполагалось Ученые предсказали точную дату конца Вселенной— и он случится раньше, чем предполагалось

Ученые впервые назвали точную дату конца Вселенной

Inc.
Что такое «эффект Микеланджело» в психологии отношений? Узнайте факт и совет от психологов Что такое «эффект Микеланджело» в психологии отношений? Узнайте факт и совет от психологов

Как «эффект Микеланджело» учит поддерживать друг друга на пути к самореализации

ТехИнсайдер
Репортаж из томографа Репортаж из томографа

Как наш мозг принимает решения?

Ведомости
Новая жизнь биткоина Новая жизнь биткоина

Почему государства проявляют все больше интереса к криптовалютам?

Монокль
Страна для путешествий Страна для путешествий

Внутренний турпоток в России в 2024 г. достиг исторического максимума

Ведомости
В России могут ввести 4-дневную рабочую неделю. Как это отразится на людях? В России могут ввести 4-дневную рабочую неделю. Как это отразится на людях?

О возможности введения четырехдневной рабочей недели и ее последствиях

Psychologies
Красная и белая Красная и белая

Как выбрать качественную консервированную фасоль

Лиза
7 ошибок, мешающих вам стать увереннее в себе 7 ошибок, мешающих вам стать увереннее в себе

Как поднять самооценку? Отказаться от вредного или отжившего себя старого

Psychologies
Почему фильм «Крейвен-охотник» о супергерое с русскими корнями провалился в прокате Почему фильм «Крейвен-охотник» о супергерое с русскими корнями провалился в прокате

Почему экранизация комикса с саундтреком-колыбельной провалился в прокате

Forbes
Решиться стать родителями Решиться стать родителями

Радмила Хакова о том, как она пять лет готовилась к рождению дочери

Afternoon Seasons of life
Про сильный пол Про сильный пол

С возрастом нарушается работа важных органов и систем мужского организма

Лиза
Астероид с вероятностью 1,2% может столкнуться с Землей в 2032 году Астероид с вероятностью 1,2% может столкнуться с Землей в 2032 году

Ученые NASA заметили астероид, который может врезаться в Землю в 2032 году

ТехИнсайдер
Аx, белый теплоход… Аx, белый теплоход…

Astondoa Ax8 — моторная яхта-кроссовер из стеклопластика

Y Magazine
«История России языком дворянских гербов» «История России языком дворянских гербов»

Какое изображение можно считать гербом?

N+1
Грибник грибника видит издалека. О новом фильме Франсуа Озона «Что случилось осенью» Грибник грибника видит издалека. О новом фильме Франсуа Озона «Что случилось осенью»

Криминальная драма Франсуа Озона «Что случилось осенью»

СНОБ
Чудеса Кавказа: чем вас удивит этот край Чудеса Кавказа: чем вас удивит этот край

Кавказ хранит много тайн, и далеко не все они открываются путешественникам

Караван историй
Бизнес расширил границы Бизнес расширил границы

Бизнес стал чаще летать за рубеж в 2024, это связано с новыми бизнес-контактами

Ведомости
Житница и здравница Кавказа Житница и здравница Кавказа

Обзор АПК Ставропольского края

Агроинвестор
Как итальянский Ренессанс повлиял на русскую и западную культуры Как итальянский Ренессанс повлиял на русскую и западную культуры

Насколько сильным оказалось влияние итальянского Возрождения на русскую культуру

Inc.
Колбаса и хлеб на ветках: топ необычных деревьев с самыми странными плодами Колбаса и хлеб на ветках: топ необычных деревьев с самыми странными плодами

Могут ли на деревьях расти огурцы?

ТехИнсайдер
Психологический портрет: что такое панические атаки Психологический портрет: что такое панические атаки

Что испытывает человек при приступах паники?

Forbes
Панацея от старения или вредный миф: что ученые говорят об опасности антиоксидантов Панацея от старения или вредный миф: что ученые говорят об опасности антиоксидантов

Насколько антиоксиданты безопасны и существует ли у них будущее?

Forbes
Что полезнее — ром, джин или коньяк? Что полезнее — ром, джин или коньяк?

В числе наиболее полезных спиртных молва числит джин, ром и коньяк. Так ли это?

Maxim
Скажите «сыр»: почему люди практически всегда улыбаются на фотографиях Скажите «сыр»: почему люди практически всегда улыбаются на фотографиях

Почему мы автоматически улыбаемся перед камерой, как зародился этот феномен?

ТехИнсайдер
Под прикрытием Под прикрытием

Как не стать невольным помощником преступников

Лиза
Новая жизнь Новая жизнь

Как прийти в себя после праздников за несколько дней

Лиза
Открыть в приложении