ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Иммерсивное движение: какие перспективы у трансляций спорта в виртуальной реальности Иммерсивное движение: какие перспективы у трансляций спорта в виртуальной реальности

Как дополненная и виртуальная реальность входят в нашу повседневность

Forbes
Ирина Тиусонина — о премии Wheretoeat, российских ресторанах в Дубае и выходе на международный рынок Ирина Тиусонина — о премии Wheretoeat, российских ресторанах в Дубае и выходе на международный рынок

Как изменилась ресторанная индустрия и почему звезды Мишлен больше неактуальны

СНОБ
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Заглянуть за горизонт Заглянуть за горизонт

Тувинская музыка, в которой гармонично сочетаются фольклор и современные веяния

Men Today
Нейросети-растениеводы Нейросети-растениеводы

Как нейросети помогают узнать, сколько удобрений нужно вносить в почву

Санкт-Петербургский университет
Как сумчатые подделали хищников Как сумчатые подделали хищников

В Южном полушарии у саблезубых кошек были крайне экзотические аналоги

Наука и техника
5 новых американских кроссоверов, которые появились в России. Фото и цены 5 новых американских кроссоверов, которые появились в России. Фото и цены

Какие новые американские кроссоверы привозят в Россию дилеры

РБК
Что такое «кофейный сон» и кому он поможет Что такое «кофейный сон» и кому он поможет

Почему иногда привычная чашка кофе перестает бодрить?

Psychologies
Не всегда голодный: 7 художников, которые были невероятно богатыми при жизни Не всегда голодный: 7 художников, которые были невероятно богатыми при жизни

Художники, которые не только создавали шедевры, но и зарабатывали на них

ТехИнсайдер
Как отстаивать свое мнение и не бояться получить отказ: техники работы со страхом Как отстаивать свое мнение и не бояться получить отказ: техники работы со страхом

Боитесь отстаивать свое мнение, но хотите научиться это делать?

Psychologies
Японцы представили 16-килограммовую робособаку с открытой архитектурой Японцы представили 16-килограммовую робособаку с открытой архитектурой

Робособаку MEVIUS можно собрать из коммерчески доступных компонентов

N+1
Женские дела Женские дела

Гинекологические заболевания можно избежать, если вовремя обратиться к врачу

Лиза
Тоня Углова Тоня Углова

Автор игрушки кота Владислава про гримасы и фрейдистскую концепцию «жуткого»

Собака.ru
Павел Стародубцев: Без хорошего дизайна компания будет размазней Павел Стародубцев: Без хорошего дизайна компания будет размазней

Дизайнер Павел Стародубцев — про Артемия Лебедева и русский визуальный код

СНОБ
Наука в фантастике: эпизоды истории Наука в фантастике: эпизоды истории

Как идея о других мирах стала плодотворной для жанра фантастики и для культуры

Наука и жизнь
«110»: драма с Елизаветой Боярской, в которой преступление разделяет мать и дочь «110»: драма с Елизаветой Боярской, в которой преступление разделяет мать и дочь

«110»: фильм-высказывание о том, как мы разучились слышать друг друга

Forbes
Антидворянец: Макс Линдер Антидворянец: Макс Линдер

Слухи и сплетни о визите легендарной кинозвезды Макса Линдера в Петербург

Правила жизни
Братья и сестры: обида длиною в жизнь Братья и сестры: обида длиною в жизнь

Как наладить отношения с братом или сестрой

Лиза
Как общаться с партнером, чтобы не разрушить отношения Как общаться с партнером, чтобы не разрушить отношения

Почему мы не можем найти взаимопонимание в отношениях?

Psychologies
От подполья до экранизаций на Netflix: как китайская научная фантастика покоряет мир От подполья до экранизаций на Netflix: как китайская научная фантастика покоряет мир

Почему мало кто за пределами КНР слышал об азиатском сай-фае

Forbes
Почему буксует всегда одно колесо – и еще 3 необычных факта о дифференциале автомобиля Почему буксует всегда одно колесо – и еще 3 необычных факта о дифференциале автомобиля

Дифференциал: что это за устройство, зачем он нужен?

ТехИнсайдер
Жить, сниматься, любить: как Софи Лорен стала воплощением мечты Жить, сниматься, любить: как Софи Лорен стала воплощением мечты

Удалось ли Марко Спаньоли показать Софи Лорен такой, какое ее знают близкие

СНОБ
Российская инфраструктура ищет партнеров Российская инфраструктура ищет партнеров

Государственно-частное партнерство стало локомотивом для больших проектов

РБК
«Не отрекаются любя»: 5 популярных ретропесен, в которых поется о нездоровых отношениях «Не отрекаются любя»: 5 популярных ретропесен, в которых поется о нездоровых отношениях

Далеко не все ретропесни имеют позитивный, с точки зрения психологии, посыл

Psychologies
Десерт, который свел с ума весь мир: в чем феномен дубайского шоколада и как его приготовить Десерт, который свел с ума весь мир: в чем феномен дубайского шоколада и как его приготовить

В чем же секрет сладости, штурмом захватившей интернет, и каков ее рецепт?

ТехИнсайдер
Владимир Гостюхин: «В советском кино ни одни съемки не обходились без романа» Владимир Гостюхин: «В советском кино ни одни съемки не обходились без романа»

«На съемках всегда особая атмосфера. В «Оттепели» это хорошо показано»

Коллекция. Караван историй
Что делать, если новая кожаная сумка пахнет химикатами: 5 советов по борьбе с неприятным ароматом Что делать, если новая кожаная сумка пахнет химикатами: 5 советов по борьбе с неприятным ароматом

Из-за чего появляется запах химикатов и как от него избавиться?

ТехИнсайдер
«Криминальному чтиву» Тарантино 30 лет. Вспоминаем, как создавался культовый криминальный роман «Криминальному чтиву» Тарантино 30 лет. Вспоминаем, как создавался культовый криминальный роман

«Криминальное чтиво»: создание и влияние культовой картины Тарантино

Правила жизни
Что за ураган «Милтон», который грозит разрушить США? Что за ураган «Милтон», который грозит разрушить США?

Ураган «Милтон» уже назвали самым разрушительным за столетие

Maxim
Экономике предложили альтернативы Экономике предложили альтернативы

Как возможное ухудшение макроэкономической ситуации повлияет на АПК

Агроинвестор
Открыть в приложении