ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Разделение на этапы при ударе о воду оказалось важным свойством игры в «блинчики» Разделение на этапы при ударе о воду оказалось важным свойством игры в «блинчики»

Физики углубились в детали подпрыгивания «блинчиков»

N+1
И в горе, и в хорроре И в горе, и в хорроре

«Спи»: ужасы семейных ценностей

Weekend
Тяжелый легкий бег Тяжелый легкий бег

Как работает организм на марафонских дистанциях

Популярная механика
Ольга Смирнова: «Я всегда говорю: люди воспринимают друг друга не по одежке, а по энергетике» Ольга Смирнова: «Я всегда говорю: люди воспринимают друг друга не по одежке, а по энергетике»

«Сегодня ты звезда, а через месяц тебя сменят другие»

Коллекция. Караван историй
Сила огня и металла: как женщины работают в кузнице и почему не боятся тяжелого труда Сила огня и металла: как женщины работают в кузнице и почему не боятся тяжелого труда

Мастерицы кузнечного дела — о рабочей рутине и стереотипах

Forbes
Что такое «изометрические упражнения» и почему они полезны Что такое «изометрические упражнения» и почему они полезны

Что такое изометрические тренировки и как они отличаются от динамических

ТехИнсайдер
«Я хочу построить наследие»: роман о рабыне, которая стала предпринимательницей «Я хочу построить наследие»: роман о рабыне, которая стала предпринимательницей

Отрывок из романа Ванессы Райли «Королева острова»

Forbes
Переславль-Залесский Переславль-Залесский

Славный городок, уютно расположившийся на берегу Плещеева озера

КАНТРИ Русская азбука
Yes, today! Film: как увлечение музыкой и театром помогло ведущему мероприятий запустить свою студию видеопродакшена Yes, today! Film: как увлечение музыкой и театром помогло ведущему мероприятий запустить свою студию видеопродакшена

История Артема Жданова — о пути творческого человека в мире бизнеса

Inc.
«Джекпот»: криминальная комедия Александра Ханта про выигрыш и проигрыши «Джекпот»: криминальная комедия Александра Ханта про выигрыш и проигрыши

«Джекпот» — лучший фильм Александра Ханта

СНОБ
«Кровавый зуб» «Кровавый зуб»

...Из-под ног вспорхнули рябчики. Кто-то удивлённо спросил: «Это что, кровь?»

Наука и жизнь
Буржуйка в изразцах Буржуйка в изразцах

Изразцы Ярославля как источник вдохновения для строительства печки на своей даче

КАНТРИ Русская азбука
Ярославль: А что вокруг? Ярославль: А что вокруг?

Интересные городки-спутники Ярославля

КАНТРИ Русская азбука
Любимая дочь диктатора: история Эдды Муссолини — самой опасной женщины Европы Любимая дочь диктатора: история Эдды Муссолини — самой опасной женщины Европы

«Нет смысла вести себя хорошо, если знаешь, что тебя ждет гильотина»

VOICE
Не переношу критику Не переношу критику

Как научиться спокойно воспринимать замечания руководства

Лиза
«Дорожная карта будущего» «Дорожная карта будущего»

Как страны будут разрабатывать устойчивое авиационное топливо

РБК
Теплый ламповый криминал Теплый ламповый криминал

«Людвиг»: история робкого детектива в Кембридже

Weekend
Какие книги помогут разобраться во французском искусстве XVII–XIX веков — рекомендации от Пушкинского музея Какие книги помогут разобраться во французском искусстве XVII–XIX веков — рекомендации от Пушкинского музея

Лучшие книги о французском искусстве XVII–XIX веков

СНОБ
Абсент для горечи и картофель для текстуры — как приготовить идеальный джин-тоник Абсент для горечи и картофель для текстуры — как приготовить идеальный джин-тоник

Почему джин-тоник такой популярный, в каких пропорциях смешивать ингридиенты?

СНОБ
Алексей Новиков: «Кибербезопасность становится несущей конструкцией для бизнеса» Алексей Новиков: «Кибербезопасность становится несущей конструкцией для бизнеса»

Почему русский кибербез интересен мировому сообществу

РБК
Приток восточных генов в Рим начался еще в эпоху Республики Приток восточных генов в Рим начался еще в эпоху Республики

Приток людей с восточными генами в Рим на 200 лет раньше, чем предполагалось

N+1
Ключ к осознанному забыванию Ключ к осознанному забыванию

Можно ли с помощью медитаций научиться намеренно забывать ненужную информацию?

Санкт-Петербургский университет
Какой стороной стелить фольгу — глянцевой или матовой? Вопрос, на который многие затрудняются ответить Какой стороной стелить фольгу — глянцевой или матовой? Вопрос, на который многие затрудняются ответить

Какой стороной фольги правильно оборачивать продукты — матовой или глянцевой?

ТехИнсайдер
Будет вам наукой Будет вам наукой

Семь свежих исследований, чтобы вы держали руку на пульсе актуальных знаний

Men Today
Стоит ли дружить с бывшим: рассуждения психолога Стоит ли дружить с бывшим: рассуждения психолога

Нужно ли поддерживать связь с тем, кого еще недавно любил?

Psychologies
Расстройства сна: самые страшные болезни, связанные с недостатком качественного отдыха Расстройства сна: самые страшные болезни, связанные с недостатком качественного отдыха

Рассказываем о сонных недугах, пережить которые не пожелаешь даже врагу

ТехИнсайдер
Кто не работает, тот не ест: как в СССР ловили тунеядцев и заставляли их трудиться Кто не работает, тот не ест: как в СССР ловили тунеядцев и заставляли их трудиться

Как в СССР боролись с теми, кто отказывался от труда по собственному желанию

ТехИнсайдер
Фононы оказались главными виновниками теплового планарного эффекта Холла Фононы оказались главными виновниками теплового планарного эффекта Холла

Физики поставили под сомнение причины, по которым возникает эффект Холла

N+1
Как управлять через сигналы и не доводить до кризисов Как управлять через сигналы и не доводить до кризисов

Распространенные ошибки руководителей из книги «Менеджмент глазами ресторатора»

Forbes
Операторы просят отложить вступление в силу новых правил продажи сим-карт иностранцам Операторы просят отложить вступление в силу новых правил продажи сим-карт иностранцам

Операторы попросили отложить новые требования по продаже сим-карт

Forbes
Открыть в приложении