Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Дымзавесы и перцовый газ: как оборонка СССР создавала противоугонные системы Дымзавесы и перцовый газ: как оборонка СССР создавала противоугонные системы

Охранная система, которая работала по принципу газового оружия, существовала

ТехИнсайдер
Здоров ли сайт: как провести аудит самостоятельно и когда привлекать специалистов Здоров ли сайт: как провести аудит самостоятельно и когда привлекать специалистов

Как самостоятельно выявить слабые места сайта?

Inc.
Воздушные винты помогли ходячему роботу сохранить равновесие во время бега Воздушные винты помогли ходячему роботу сохранить равновесие во время бега

Робот KOU-III не может летать — он использует винты для равновесия

N+1
Новая жизнь биткоина Новая жизнь биткоина

Почему государства проявляют все больше интереса к криптовалютам?

Монокль
Обман зрения: как популярные оптические иллюзии дурят наш мозг Обман зрения: как популярные оптические иллюзии дурят наш мозг

Оптические иллюзии - это прямое подтверждение того, что наш мозг чертовски ленив

Популярная механика
Больше никакого мутного налета и жира: как отмыть стеклянные крышки кастрюль и сковород Больше никакого мутного налета и жира: как отмыть стеклянные крышки кастрюль и сковород

Как вернуть былую чистоту и блеск стеклянным крышкам?

ТехИнсайдер
5 типичных ошибок, которые мешают нам избавиться от влияния тяжелого детства 5 типичных ошибок, которые мешают нам избавиться от влияния тяжелого детства

Что нам мешает избавиться от негативного шлейфа прошлого?

Psychologies
Ветер с Востока Ветер с Востока

Принципы «Магической уборки» японской писательницы Мари Кондо

Лиза
Священный знак Священный знак

«Кого Юпитер хочет опозорить, лишает своего орла»

Дилетант
«То, что на экране, — это психическая реальность тех, кто смотрит, а не тех, кого показывают» «То, что на экране, — это психическая реальность тех, кто смотрит, а не тех, кого показывают»

Режиссер Рената Джало о своем фильме «На этой земле»

Weekend
Чудеса Кавказа: чем вас удивит этот край Чудеса Кавказа: чем вас удивит этот край

Кавказ хранит много тайн, и далеко не все они открываются путешественникам

Караван историй
Желание женщины — закон: каким сегодня показывают секс в кино Желание женщины — закон: каким сегодня показывают секс в кино

Как «Плохая девочка» исследует тему эмоциональной близости через призму секса

СНОБ
Человек человеку… волк: разбираемся в эволюции оборотней в кино Человек человеку… волк: разбираемся в эволюции оборотней в кино

Откуда появились истории о вервольфах в кинематографе?

Правила жизни
5 самых страшных форм манипуляции 5 самых страшных форм манипуляции

От газлайтинга до триангуляции: как вами может манипулировать партнер?

Psychologies
«Настоящая боль»: как фильм Джесси Айзенберга деликатно исследует тему Холокоста «Настоящая боль»: как фильм Джесси Айзенберга деликатно исследует тему Холокоста

Кино о теме Холокоста и запутанных отношениях двух братьев

Forbes
От местечковой драмы до дела Бейлиса. Еврейское кино в царской России От местечковой драмы до дела Бейлиса. Еврейское кино в царской России

Еврейская культура оставалась заметной частью повседневной жизни миллионов людей

Дилетант
«Секс за еду»: биолог объяснила, почему женщинам важно, чтобы на первом свидании платил мужчина «Секс за еду»: биолог объяснила, почему женщинам важно, чтобы на первом свидании платил мужчина

Почему людям так важно, кто платит за еду на свидание? Отвечает биолог

Psychologies
Стали не хватает строек Стали не хватает строек

Что повлияло на снижение производства стали в России в 2024 году?

Ведомости
Что делать бизнесу с фейками в сети Что делать бизнесу с фейками в сети

Со всеми фейковыми публикациями можно бороться по одной схеме

Inc.
Как жировые отложения могут быть ключом к более долгой и здоровой жизни Как жировые отложения могут быть ключом к более долгой и здоровой жизни

Что, если ключ к вашему здоровому образу жизни скрывается у всех на виду?

ТехИнсайдер
Как в СССР создавали самолет для Сталина – дедушку «Борта №1» Как в СССР создавали самолет для Сталина – дедушку «Борта №1»

Как безопасно доставить через пол-континента вождя народов, боящегося летать

ТехИнсайдер
«Хорошо, что ты все-таки родилась»: почему ребенок не должен знать, что мать планировала аборт «Хорошо, что ты все-таки родилась»: почему ребенок не должен знать, что мать планировала аборт

Нужно ли рассказывать о не совершенном аборте подросшему сыну или дочери?

Psychologies
Гремучие змеи попили воды с тел сородичей Гремучие змеи попили воды с тел сородичей

Герпетологи изучили, как зеленые гремучники собирают дождевую воду

N+1
Турецкие сериалы, экстрасенсы и астрология: эксперты назвали самые популярные «постыдные удовольствия» россиянок Турецкие сериалы, экстрасенсы и астрология: эксперты назвали самые популярные «постыдные удовольствия» россиянок

Топ удовольствий, о которых стыдно говорить

Psychologies
Генетики прочитали ДНК последних охотников-собирателей Гималаев Генетики прочитали ДНК последних охотников-собирателей Гималаев

Генетики проанализировали ДНК больше ста представителей группы рауте

N+1
Палеогенетики прочитали ДНК четырех людей эпохи неолита из памятника Лепенски-Вир Палеогенетики прочитали ДНК четырех людей эпохи неолита из памятника Лепенски-Вир

Палеогенетики прочитали ДНК четырех человек на памятнике Лепенски-Вир

N+1
Бородатый анекдот Бородатый анекдот

«Почему, чёрт возьми, развалился Советский Союз?»

Дилетант
Открытие памятника Сталину Открытие памятника Сталину

Идея поставить памятник советскому вождю в Праге возникла в 1949 году

Дилетант
4 признака того, что вы знаете своего партнера слишком хорошо 4 признака того, что вы знаете своего партнера слишком хорошо

Признаки того, что вы видите вместо своего партнера набор шаблонов

Psychologies
Остановить мигрень Остановить мигрень

Приступы повторяются в самый неподходящий момент? Попробуем победить мигрень

Лиза
Открыть в приложении