ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Квантово-запутанная премия. От невероятного эффекта до технологии Квантово-запутанная премия. От невероятного эффекта до технологии

Установление нарушения неравенств Белла и новаторство в квантовой информатике

Наука и жизнь
Кофейно-чайная зависимость страны Кофейно-чайная зависимость страны

Есть ли возможность увеличить долю сырья на рынке горячих напитков России

Агроинвестор
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Что делать, если мать винит вас во всем: 6 способов не вестись на эту манипуляцию Что делать, если мать винит вас во всем: 6 способов не вестись на эту манипуляцию

Как, никого не обидев, освободиться от влияния родителя

Psychologies
Кирилл Гребенщиков Кирилл Гребенщиков

Кирилл Гребенщиков об особенностях игры в сериале «Наследники. Дар крови»

Лиза
От стрелочных приборов до бортовых компьютеров: как развивалась авионика в самолетах От стрелочных приборов до бортовых компьютеров: как развивалась авионика в самолетах

Как менялись технологии авионики на протяжении веков

ТехИнсайдер
Операторы просят отложить вступление в силу новых правил продажи сим-карт иностранцам Операторы просят отложить вступление в силу новых правил продажи сим-карт иностранцам

Операторы попросили отложить новые требования по продаже сим-карт

Forbes
Трапа нет, багаж с собой: откуда у большого советского лайнера Ил-86 эти 3 странные особенности Трапа нет, багаж с собой: откуда у большого советского лайнера Ил-86 эти 3 странные особенности

​​​​​​​Все пассажирские самолеты устроены примерно одинаково, но не Ил-86

ТехИнсайдер
Дожди еще впереди: как выбрать качественный зонт, который не подведет в плохую погоду Дожди еще впереди: как выбрать качественный зонт, который не подведет в плохую погоду

На какие факторы нужно обращать внимание при покупке зонта

ТехИнсайдер
ИИ наступает: что ждет российский агротех ИИ наступает: что ждет российский агротех

Зачем фермерам искусственный интеллект и беспилотники

Inc.
РПП /расстройство пищевого поведения/ РПП /расстройство пищевого поведения/

Когда погрешности в питании становятся симптомами РПП?

Grazia
Зачем нам ловить нейтрино? Зачем нам ловить нейтрино?

Что удалось понять про нейтрино и как это было, — в беседе с Валерием Петковым

Наука и жизнь
Эпоха гиперсвязности: как защитить IT-активы и не стать жертвой кибератак Эпоха гиперсвязности: как защитить IT-активы и не стать жертвой кибератак

Как эффективные технологии стали опасностью для IT-индустрии

Forbes
Азиатская лихорадка: к чему приводит одержимость учебными достижениями Азиатская лихорадка: к чему приводит одержимость учебными достижениями

Почему азиатская образовательная модель восхищает и тревожит одновременно

Forbes
Думать про далекое будущее: как женщины руководят НКО и решают социальные проблемы Думать про далекое будущее: как женщины руководят НКО и решают социальные проблемы

С чем сталкиваются женщины в кризисных ситуациях и где найти силы продолжать

Forbes
«Для IPO рынок сейчас слишком спекулятивный» «Для IPO рынок сейчас слишком спекулятивный»

О том, как криптовалюты отбирают аудиторию у классических брокеров

Монокль
Наука в фантастике: эпизоды истории Наука в фантастике: эпизоды истории

Как идея о других мирах стала плодотворной для жанра фантастики и для культуры

Наука и жизнь
Он написал самоубийство Он написал самоубийство

Как цензурные запреты помогли «Вертеру» Гёте стать главным романом эпохи

Weekend
Не кошкин дом: как спасают животных на стройках и в зонах реконструкции Не кошкин дом: как спасают животных на стройках и в зонах реконструкции

Можно ли гуманно справиться с проблемой бездомных животных в России?

Forbes
Столетняя икона Столетняя икона

Отрывок из автобиографии самой пожилой fashion-знаменитости в мире

RR Люкс.Личности.Бизнес.
Квантовая готовность: ждет ли бизнес новая технологическая революция Квантовая готовность: ждет ли бизнес новая технологическая революция

Существует риск проспать квантовую революцию, считает Андрей Скорочкин

Forbes
Город, сбросивший историческую память Город, сбросивший историческую память

Архангельск: морозное процветание новой стабильности

Weekend
«Черноногие» «Черноногие»

Существует несколько версий того, откуда появилось выражение «черноногие»

Дилетант
Прекрасный армянин Прекрасный армянин

Микаэл Лорис-Меликов подарил России пятнадцать месяцев либеральных мечтаний

Дилетант
7 комнатных растений, которые можно выращивать в обычной банке 7 комнатных растений, которые можно выращивать в обычной банке

Как в банке вырастить комнатный цветок?

VOICE
Тайны цирковой династии Кио Тайны цирковой династии Кио

Разобраться в хитросплетениях семейных связей династии Кио очень нелегко

Коллекция. Караван историй
Почему произошло извержение вулкана Хунга-Тонга в 2022 году Почему произошло извержение вулкана Хунга-Тонга в 2022 году

Что послужило причиной крупнейшего извержения вулкана в 2022 году?

ТехИнсайдер
Потолок золотой: как ограничение бюджетов в «Формуле-1» помогло заработать всем Потолок золотой: как ограничение бюджетов в «Формуле-1» помогло заработать всем

Как организаторам «Формулы-1» удалось вернуть к ней интерес

Forbes
В какой позе лучше всего спать В какой позе лучше всего спать

Какое положение для все же лучше всего подходит для полноценного ночного отдыха?

ТехИнсайдер
Как платная трасса увеличивает экономический потенциал Самарской области Как платная трасса увеличивает экономический потенциал Самарской области

О перспективах развития платных дорог в РФ

РБК
Открыть в приложении