Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Короткие ножки и большая уверенность в себе: 10 интересных фактов о таксах Короткие ножки и большая уверенность в себе: 10 интересных фактов о таксах

Длинное тело, короткие лапы, самодостаточность и прыткий ум — знакомьтесь, такса

ТехИнсайдер
Секс в положении Секс в положении

Как будущей маме получать удовольствие в постели и не навредить малышу

Лиза
Что такое DDoS-атака и как она работает Что такое DDoS-атака и как она работает

Объясняем, что такое DDoS и как оно работает

ТехИнсайдер
Панацея от старения или вредный миф: что ученые говорят об опасности антиоксидантов Панацея от старения или вредный миф: что ученые говорят об опасности антиоксидантов

Насколько антиоксиданты безопасны и существует ли у них будущее?

Forbes
Дышать или не дышать: насколько эффективна дорогостоящая ксенонотерапия Дышать или не дышать: насколько эффективна дорогостоящая ксенонотерапия

Ксенонотерапия: что это за метод, безопасен ли он и насколько полезен в лечении?

Forbes
За гранью человеческого За гранью человеческого

Как воспринимают мир существа, наделенные нечеловеческими чувствами?

Вокруг света
Облака над сушей уменьшили нисходящее длинноволновое излучение Облака над сушей уменьшили нисходящее длинноволновое излучение

Еще один природный механизм, противостоящий потеплению

N+1
7 принципов женщин, живущих в счастливых отношениях 7 принципов женщин, живущих в счастливых отношениях

Главные принципы, которых придерживаются успешные в личной жизни женщины

Psychologies
Маменькин престол Маменькин престол

Существовала ли в действительности папесса Иоанна?

Дилетант
К гадалке не ходи: за последние четыре года продажи карт таро выросли в семь раз К гадалке не ходи: за последние четыре года продажи карт таро выросли в семь раз

Как и почему растет «гадательный» сегмент в тиражах издательств?

Forbes
Елена Муравьева: «Клоунский нос тебя защищает, дает силы и возможность быть собой» Елена Муравьева: «Клоунский нос тебя защищает, дает силы и возможность быть собой»

Больничная клоунада не про актерские амбиции, а про понимание ситуации

Коллекция. Караван историй
9 хаков для уборки, которые не работают 9 хаков для уборки, которые не работают

Несколько мифов о наведении чистоты, о которых давно пора забыть

VOICE
10 советов, как сбросить вес после новогодних праздников 10 советов, как сбросить вес после новогодних праздников

Как вернуться к нормальному состоянию тела после длительных праздников?

Psychologies
Альфрид Лэнгле — Forbes: «Кризис должен быть стимулом проживать жизнь по максимуму» Альфрид Лэнгле — Forbes: «Кризис должен быть стимулом проживать жизнь по максимуму»

Как справиться с чувством беспомощности? Объясняет Альфрид Лэнгле

Forbes
Ветер с Востока Ветер с Востока

Принципы «Магической уборки» японской писательницы Мари Кондо

Лиза
Подсказанный Солнцем Подсказанный Солнцем

Какое вещество сперва нашли не на Земле

Санкт-Петербургский университет
«Секс за еду»: биолог объяснила, почему женщинам важно, чтобы на первом свидании платил мужчина «Секс за еду»: биолог объяснила, почему женщинам важно, чтобы на первом свидании платил мужчина

Почему людям так важно, кто платит за еду на свидание? Отвечает биолог

Psychologies
Что делать, если вы стали жертвой гостинга: 5 подсказок от психолога Что делать, если вы стали жертвой гостинга: 5 подсказок от психолога

Почему люди могут внезапно пропадать из круга нашего общения?

Psychologies
Повреждения на 30-тысячелетних зубах кроманьонцев объяснили пирсингом Повреждения на 30-тысячелетних зубах кроманьонцев объяснили пирсингом

Антрополог проанализировал повреждения на зубах древних людей

N+1
5 признаков, указывающих на то, что вы по-настоящему зрелая личность 5 признаков, указывающих на то, что вы по-настоящему зрелая личность

Можете ли вы похвастаться тем, что достигли психологической зрелости?

Maxim
Утомленные школой Утомленные школой

Как облегчить жизнь ребенку в тяжелое для него время?

Лиза
Спать надо всем Спать надо всем

Почему важно изучать сон водных млекопитающих?

Наука и жизнь
Гид по декольте Гид по декольте

Почему о зоне декольте тоже стоит заботиться?

Лиза
Февральская революция: как искусственный интеллект может повысить производительность труда Февральская революция: как искусственный интеллект может повысить производительность труда

Русские ученые устроили шестую промышленную революцию!

ТехИнсайдер
Темный угол Темный угол

10 мест, которые остаются грязными даже после генеральной уборки

Лиза
«Хризапелия прыгает с ветки, расправив ребра» «Хризапелия прыгает с ветки, расправив ребра»

Где живут, чем питаются и как летают змеи — и почему у них раздвоенный язык

Weekend
«Поговорите со своим страхом»: 3 совета, как психологически подготовиться к смене работы «Поговорите со своим страхом»: 3 совета, как психологически подготовиться к смене работы

Разбираемся, как безболезненно сменить род или место деятельности

Psychologies
Давай поговорим Давай поговорим

7 опасных болезней, которые вызывает невысказанная обида

Лиза
Горький привкус: почему не останавливается отток населения из Нижнего Новгорода Горький привкус: почему не останавливается отток населения из Нижнего Новгорода

Из-за каких причин жители вроде бы процветающего Нижнего покидают город?

Forbes
Как CJM помогает бизнесу нанимать сотрудников Как CJM помогает бизнесу нанимать сотрудников

Как CJM позволяет выявлять ключевые барьеры на пути соискателя к вакансии

Inc.
Открыть в приложении