ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не сильно стильный пол Не сильно стильный пол

О природе сложных отношений российских мужчин с модой

Men Today
Что такое «мужской грипп» и существует ли он: только наука Что такое «мужской грипп» и существует ли он: только наука

Болеют ли мужчины как-то особенно?

ТехИнсайдер
Улучшит работу мозга! Вот почему надо есть больше свеклы: интересные факты Улучшит работу мозга! Вот почему надо есть больше свеклы: интересные факты

Почему вам нужно обязательно включить свеклу в свой рацион?

ТехИнсайдер
Российская инфраструктура ищет партнеров Российская инфраструктура ищет партнеров

Государственно-частное партнерство стало локомотивом для больших проектов

РБК
Дизайнер Никита Калмыков — про свой бренд ODOR, реализм и вдохновение — интервью на «Снобе» Дизайнер Никита Калмыков — про свой бренд ODOR, реализм и вдохновение — интервью на «Снобе»

Никита Калмыков о фаст-фешене, старинных кружевах и объемах продаж

СНОБ
Что такое опорный подшипник, где он находится и как его проверить Что такое опорный подшипник, где он находится и как его проверить

Изношенный «опорник» вызывает шумы и усиливает износ элементов подвески

РБК
Женская самоценность: 3 ступени к уверенности в себе Женская самоценность: 3 ступени к уверенности в себе

Женская уверенность в себе: из чего она состоит и можно ли её укрепить?

Psychologies
Когда Африку разрезали как пирог… Когда Африку разрезали как пирог…

Как дикий империализм, облачившись в «цивилизованный костюм», делил Африку

Знание – сила
Искусство соединять Искусство соединять

Пентхаус с нестандартной планировкой и смелыми сочетаниями фактур

SALON-Interior
Квазипериодические рентгеновские вспышки вновь связали с событиями приливного разрушения Квазипериодические рентгеновские вспышки вновь связали с событиями приливного разрушения

Астрономы обнаружили девять квазипериодических рентгеновских вспышек

N+1
Борьба с вирусом: как быстро вылечить простуду Борьба с вирусом: как быстро вылечить простуду

Когда простуду можно вылечить самостоятельно?

ТехИнсайдер
«Начинать нужно с пороха» «Начинать нужно с пороха»

Михаил Хубутия о форуме «ORЁLEXPO 2024» и проблемах отрасли товаров для охоты

Деньги
Кашель, прощай! Кашель, прощай!

Разнообразие причин кашля вызывает и разнообразие видов. Какие есть?

Лиза
Елена Образцова. Непобедимая Елена Образцова. Непобедимая

«У нее Графиня могла быть строгой, могла быть старой, немощной, веселой»

Караван историй
28 вопросов, которые сближают с людьми 28 вопросов, которые сближают с людьми

Как создать условия, чтобы близкий человек открылся вам.

Psychologies
Центральную Анатолию назвали местом одомашнивания овец Центральную Анатолию назвали местом одомашнивания овец

Скорее всего, люди одомашнили конийских муфлонов в Центральной Анатолии

N+1
3 этапа отношений, через которые проходит каждая пара 3 этапа отношений, через которые проходит каждая пара

Какие этапы проходят все влюбленные и что за опасности их подстерегают?

Psychologies
Суздаль Суздаль

Суздаль — город-музей с забавной традицией праздновать День огурца

КАНТРИ Русская азбука
5 новых американских кроссоверов, которые появились в России. Фото и цены 5 новых американских кроссоверов, которые появились в России. Фото и цены

Какие новые американские кроссоверы привозят в Россию дилеры

РБК
Зависимые от шопинга Зависимые от шопинга

Какие люди склонны совершать бессмысленные покупки

Санкт-Петербургский университет
Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу

Энанциорнис Avisaurus darwini достигал размеров ястреба и хватал добычу лапами

N+1
Не плачь, ты же мужчина! Почему сильный пол избегает походов к врачу и как это сокращает жизнь Не плачь, ты же мужчина! Почему сильный пол избегает походов к врачу и как это сокращает жизнь

Стремление соответствовать образу «настоящего мужчины» может стоить вам жизни

ТехИнсайдер
Несбыточная «четверка» Несбыточная «четверка»

Почему неадекватный таргет по инфляции является реальной проблемой

Монокль
Держать удар: что такое «экванимити» и как бизнесмены ищут опору в невозмутимости Держать удар: что такое «экванимити» и как бизнесмены ищут опору в невозмутимости

Экванимити — умение сохранять внутреннее спокойствие и гармоничное состояние

Forbes
«ПСБ стал цифровым хабом для своих клиентов» «ПСБ стал цифровым хабом для своих клиентов»

Алексей Захаров о том, как идет модернизация оборонно-промышленного комплекса

Деньги
Физики порадовали астрономов улучшенным детектором одиночных фотонов инфракрасного диапазона Физики порадовали астрономов улучшенным детектором одиночных фотонов инфракрасного диапазона

Физики разработали детектор одиночных фотонов инфракрасного диапазона

N+1
10 лучших хорроров за 2023 и 2024 годы. Часть II 10 лучших хорроров за 2023 и 2024 годы. Часть II

Фильмы на тот случай, еще последние пару лет недостаточно пощекотали вам нервы

Maxim
Курсовая работа: как выпускники психфака создали заметную школу data science Курсовая работа: как выпускники психфака создали заметную школу data science

Онлайн-школа karpov.courses начиналась как pet-проект выпускников психфака

Forbes
Павел Попов. Прыгнуть в свой страх, чтобы победить Павел Попов. Прыгнуть в свой страх, чтобы победить

Почему сегодня модные фильмы и сериалы не обходятся без артиста Павла Попова?

Караван историй
Переславль-Залесский Переславль-Залесский

Славный городок, уютно расположившийся на берегу Плещеева озера

КАНТРИ Русская азбука
Открыть в приложении