ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как искусственный интеллект помогает в научных исследованиях Как искусственный интеллект помогает в научных исследованиях

Впечатляющие сферы применения ИИ исследователями

РБК
На чем цвет стоит На чем цвет стоит

Осени к лицу желтый цвет, чего не скажешь о ваших зубах. Как сделать их белыми?

Men Today
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Бой с тенью Бой с тенью

Как съемки в сериале «Амура» помогли Алене Михайловой обрести себя

Grazia
Как платная трасса увеличивает экономический потенциал Самарской области Как платная трасса увеличивает экономический потенциал Самарской области

О перспективах развития платных дорог в РФ

РБК
Чем привлекает SERES M7? Прежде всего запахом Чем привлекает SERES M7? Прежде всего запахом

Тест-драйв премиального китайского кроссовера SERES M7

4x4 Club
Вторая жизнь моделей фораминифер Вторая жизнь моделей фораминифер

История идентификации старой музейной коллекции

Санкт-Петербургский университет
Иваново Иваново

Иваново — город «с тысячью лиц», который вас удивит

КАНТРИ Русская азбука
Мыльный кутюр Мыльный кутюр

«Модный дом»: скандалы, интриги и повестка фэшн-индустрии

Weekend
Обрести опору: как женщины стали ходить на каблуках и почему отказываются от них Обрести опору: как женщины стали ходить на каблуках и почему отказываются от них

Когда и почему женщины начали носить каблуки и зачем протестуют против них

Forbes
«Художник обидеть может каждого!» «Художник обидеть может каждого!»

Разные грани и тайны профессии от режиссера Михаила Цитриняка

Знание – сила
Восток заходит с Запада Восток заходит с Запада

Geely, но только Belgee

Автопилот
«Сейчас у центрального университета более 40 партнеров — это крупнейшие компании страны» «Сейчас у центрального университета более 40 партнеров — это крупнейшие компании страны»

В этом сентябре Центральный университет набрал абитуриентов на обучение

Деньги
Печальная история Бланш Бэрроу: «вынужденной» сообщницы Бонни и Клайда Печальная история Бланш Бэрроу: «вынужденной» сообщницы Бонни и Клайда

Бланш Бэрроу: кто она такая и как познакомилась с Бонни и Клайдом?

ТехИнсайдер
Смотри, не двинься Смотри, не двинься

5 сериалов с психотерапевтическим эффектом для мужчин (и не только)

Men Today
«Я вас понял!» «Я вас понял!»

Искренне ли Шарль де Голль полагал, что Алжир может остаться французским?

Дилетант
Кострома Кострома

Кострома — квинтэссенция русской жизни

КАНТРИ Русская азбука
Унюхал – беги: как трупный запах влияет на поведение человека Унюхал – беги: как трупный запах влияет на поведение человека

Как «запах смерти» мобилизует защитные механизмы в нашем организме

ТехИнсайдер
«Мы в ответе за тех, кого приручили»: что нужно учесть перед тем, как завести своего первого щенка «Мы в ответе за тех, кого приручили»: что нужно учесть перед тем, как завести своего первого щенка

Как подготовиться к появлению первого щенка в доме?

ТехИнсайдер
При строительстве установки для поиску нейтрино уже вынули 800 000 тонн породы При строительстве установки для поиску нейтрино уже вынули 800 000 тонн породы

Ученые проекта LBNF-DUNE врубились в скалу, чтобы сделать революцию в науке

ТехИнсайдер
Выслушать и предоставить выбор: как компании могут поддерживать сотрудниц Выслушать и предоставить выбор: как компании могут поддерживать сотрудниц

FWD.Woman Summit: о корпоративных мерах поддержки сотрудниц

Forbes
Кевин Смит Кевин Смит

Правила жизни режиссера Кевина Смита

Правила жизни
Между нами тает лед Между нами тает лед

Михаил Сергачев о том, с чего начинался его собственный путь на льду

Men Today
Сочувствие господину Пингвину Сочувствие господину Пингвину

«Пингвин»: комикс, снятый по правилам Нового Голливуда

Weekend
Почти «космос», только не плавает: как создавался последний супер-вездеход ЗИЛ Почти «космос», только не плавает: как создавался последний супер-вездеход ЗИЛ

ЗИЛ-4972: последний культовый вездеход завода имени Лихачёва

ТехИнсайдер
Искусственный снег, джакузи из обычной ванны и еще 7 необычных применений для домашнего мини-компрессора Искусственный снег, джакузи из обычной ванны и еще 7 необычных применений для домашнего мини-компрессора

Ищем забавные способы использовать домашний мини-компрессор

ТехИнсайдер
Моя радость Моя радость

Как разные домашние животные проявляют свою любовь к хозяину

Лиза
Древний скелет позволил ученым разгадать тайну формирования населения Японии! Древний скелет позволил ученым разгадать тайну формирования населения Японии!

Современный геном Японии сформировался из протокорейцев и населения Дзёмон

ТехИнсайдер
Экономике предложили альтернативы Экономике предложили альтернативы

Как возможное ухудшение макроэкономической ситуации повлияет на АПК

Агроинвестор
Улучшит работу мозга! Вот почему надо есть больше свеклы: интересные факты Улучшит работу мозга! Вот почему надо есть больше свеклы: интересные факты

Почему вам нужно обязательно включить свеклу в свой рацион?

ТехИнсайдер
Открыть в приложении