Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

У берегов Антарктиды нашли «странных» морских свинок, пауков» и бабочек У берегов Антарктиды нашли «странных» морских свинок, пауков» и бабочек

Глубины Антарктиды скрывают поразительные формы жизни

ТехИнсайдер
Иду на быт! 11 лайфхаков Иду на быт! 11 лайфхаков

Масштабный «разбор завалов»: расскажем, как сэкономить силы, время и нервы

Лиза
Информационная безопасность: десять основных видов хакерских атак Информационная безопасность: десять основных видов хакерских атак

Отрывок из книги Антона Евгеньева «Ценность ваших решений»

Forbes
3 важные фразы, которые помогут вам с партнером стать ближе 3 важные фразы, которые помогут вам с партнером стать ближе

Некоторые, казалось бы, совсем простые фразы, могут быть очень важными

Psychologies
6 самых популярных сюжетов снов 6 самых популярных сюжетов снов

Какие сюжеты снов чаще всего снятся людям?

ТехИнсайдер
Рим и германцы Рим и германцы

Встреча с варварами потрясла Рим, заставив изменить организацию римской армии

Дилетант
Восток VS Запад Восток VS Запад

Сравним отношение к радостям жизни на Востоке и Западе!

Лиза
«Шерсть дыбом: Медведи-взломщики, макаки-мародеры и другие преступники дикой природы» «Шерсть дыбом: Медведи-взломщики, макаки-мародеры и другие преступники дикой природы»

Зачем орнитологи взрывали птиц динамитом

N+1
«Не взрослей!»: 8 родительских запретов, которые портят нам жизнь «Не взрослей!»: 8 родительских запретов, которые портят нам жизнь

Как родительские запреты влияют на ребенка?

Psychologies
Бизнес расширил границы Бизнес расширил границы

Бизнес стал чаще летать за рубеж в 2024, это связано с новыми бизнес-контактами

Ведомости
От хлебного бунта до «банановых республик»: как еда меняла историю От хлебного бунта до «банановых республик»: как еда меняла историю

Как блюда и продукты становились поводами для войн и революций

Forbes
Зрелые отношения: почему люди пенсионного возраста в России стали чаще жениться Зрелые отношения: почему люди пенсионного возраста в России стали чаще жениться

Какие факторы влияют на то, что в России пенсионеры предпочитают вступать в брак

Forbes
В каком ухе шумит В каком ухе шумит

Болезнь совершенно безобидная? Врачи предупреждают: с детским отитом шутки плохи

Лиза
«Я в шаге от того, чтобы послать ее куда подальше»: история влюбленности, которая рушит дружбу подруг «Я в шаге от того, чтобы послать ее куда подальше»: история влюбленности, которая рушит дружбу подруг

Почему выдуманные романы могут сказаться не только на дружеских отношениях?

Psychologies
Мавританская Испания Мавританская Испания

Мавретания — мусульманское государство, создавшее свою уникальную культуру

Наука и техника
Молекулы, необходимые для жизни, найдены в образцах астероида Бенну Молекулы, необходимые для жизни, найдены в образцах астероида Бенну

В породе, доставленной с астероида Бенну, обнаружены 14 из 20 аминокислот

ТехИнсайдер
Разгруженные железные дороги Разгруженные железные дороги

С 2022 г. в России начался процесс активного перестроения логистических цепочек

Ведомости
Совы не то, чем кажутся: почему современное кино нельзя представить без Дэвида Линча Совы не то, чем кажутся: почему современное кино нельзя представить без Дэвида Линча

Как Линч стал одним из величайших режиссеров XX и XXI века

Forbes
«Все впереди»: о чем мечтают молодые взрослые — пациенты «Дома с маяком» «Все впереди»: о чем мечтают молодые взрослые — пациенты «Дома с маяком»

Как живут те, кому воплощать свои мечты в жизнь сложнее, чем большинству

РБК
Что полезнее — ром, джин или коньяк? Что полезнее — ром, джин или коньяк?

В числе наиболее полезных спиртных молва числит джин, ром и коньяк. Так ли это?

Maxim
Как стирать флисовые вещи, чтобы сохранить их мягкость и тепло: полезные советы Как стирать флисовые вещи, чтобы сохранить их мягкость и тепло: полезные советы

Как правильно стирать флисовые вещи, чтобы сохранить их первоначальные качества

ТехИнсайдер
Как в СССР создавали самолет для Сталина – дедушку «Борта №1» Как в СССР создавали самолет для Сталина – дедушку «Борта №1»

Как безопасно доставить через пол-континента вождя народов, боящегося летать

ТехИнсайдер
После праздника После праздника

Как избавиться от последствий праздника?

Лиза
Меланжевые войны Меланжевые войны

Выгодно ли превращать ресурсы в оружие

N+1
Без паники! 10 быстрых приемов против стресса Без паники! 10 быстрых приемов против стресса

Нужно снять напряжение? Вот способы, которые не требуют специальной подготовки

Лиза
Как в соборе Святого Маврикия впервые сфотографировали скрытые фрески Средневековья Как в соборе Святого Маврикия впервые сфотографировали скрытые фрески Средневековья

Скрытые от глаз на протяжении столетий средневековые фрески собора в городе Анже

ТехИнсайдер
МХАТ и война: отрывок из книги Софьи Пилявской МХАТ и война: отрывок из книги Софьи Пилявской

Отрывок из переиздания книги Софьи Пилявской — «Грустная книга»

СНОБ
Выдох красоты: памяти Дэвида Линча Выдох красоты: памяти Дэвида Линча

О Дэвиде Линче, его темных очках и светлом будущем

РБК
Татьяна Буланова: «Что касается любви — бросаюсь в омут с головой, и будь что будет!» Татьяна Буланова: «Что касается любви — бросаюсь в омут с головой, и будь что будет!»

Я привыкла рассчитывать на себя, мне так проще

Коллекция. Караван историй
Стали не хватает строек Стали не хватает строек

Что повлияло на снижение производства стали в России в 2024 году?

Ведомости
Открыть в приложении