ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему оборотень Джейкоб из “Сумерек” не стал суперзвездой — как Кристен Стюарт и Роберт Паттинсон Почему оборотень Джейкоб из “Сумерек” не стал суперзвездой — как Кристен Стюарт и Роберт Паттинсон

Почему про Тейлора Лотнера все забыли?

VOICE
Meta-Gene 2: программа для автоматизации процесса генетического мета-анализа Meta-Gene 2: программа для автоматизации процесса генетического мета-анализа

Программа, которая облегчает выявление генетических причин тяжелых заболеваний

Наука и техника
Немирное «земледелие» Немирное «земледелие»

Как работает система залпового минирования

Популярная механика
Убийство Джексона, причастность Бейонсе, насилие над Бибером: 6 главных теорий заговора вокруг дела Пи Дидди Убийство Джексона, причастность Бейонсе, насилие над Бибером: 6 главных теорий заговора вокруг дела Пи Дидди

В чем обвиняют рэпера Пи Дидди?

Psychologies
Петербург будущего Петербург будущего

Зачем зодчим идти в народ и как опыт Рима применить к Шушарам?

Собака.ru
Переславль-Залесский Переславль-Залесский

Славный городок, уютно расположившийся на берегу Плещеева озера

КАНТРИ Русская азбука
«Синдром Питера Пэна»: как понять, что ты имеешь дело с мужчиной, который так и не повзрослел «Синдром Питера Пэна»: как понять, что ты имеешь дело с мужчиной, который так и не повзрослел

Что такое синдром Питера Пэна и что делать, если твой партнер инфантилен?

VOICE
В гармонии с природой В гармонии с природой

Загородный дом в экостиле с элементами неоклассики

SALON-Interior
«Водородная эйфория» закончилась: почему этот источник энергии не спасет планету «Водородная эйфория» закончилась: почему этот источник энергии не спасет планету

Почему «водородная энергия» оказалась лишь иллюзией?

Forbes
Что делать, если выбрал не ту профессию: 3 рекомендации от профориентолога Что делать, если выбрал не ту профессию: 3 рекомендации от профориентолога

Как построить новую успешную карьеру, если со старой не сложилось?

Psychologies
Хеллоуинское чтиво: мистические триллеры и детективы Хеллоуинское чтиво: мистические триллеры и детективы

Книги, которые создадут мистическое настроение

Maxim
Ольга Смирнова: «Я всегда говорю: люди воспринимают друг друга не по одежке, а по энергетике» Ольга Смирнова: «Я всегда говорю: люди воспринимают друг друга не по одежке, а по энергетике»

«Сегодня ты звезда, а через месяц тебя сменят другие»

Коллекция. Караван историй
Продажи важнее креатива и ценности бренда Продажи важнее креатива и ценности бренда

Какие вызовы сегодня стоят перед российскими модными компаниями

Монокль
Эпоха гиперсвязности: как защитить IT-активы и не стать жертвой кибератак Эпоха гиперсвязности: как защитить IT-активы и не стать жертвой кибератак

Как эффективные технологии стали опасностью для IT-индустрии

Forbes
Иваново Иваново

Иваново — город «с тысячью лиц», который вас удивит

КАНТРИ Русская азбука
Алексей Маслов: «Взгляд России на Китай стал более реалистичным» Алексей Маслов: «Взгляд России на Китай стал более реалистичным»

Как меняются отношения между РФ и КНР, что нужно для выхода на китайский рынок

РБК
Бот еще: чем опасна для бизнеса «забытая» автоматизация Бот еще: чем опасна для бизнеса «забытая» автоматизация

Не стоит забывать об одном риске IT-компании — «забытой» автоматизации

Forbes
Углеродный след: правда ли, что самолеты «убивают» экологию сильнее других видов транспорта Углеродный след: правда ли, что самолеты «убивают» экологию сильнее других видов транспорта

Как авиация влияет на экологию и климат?

ТехИнсайдер
Мир, который вместе видел нас Мир, который вместе видел нас

«Противостояние»: новая экранизация Юлиана Семенова

Weekend
Что за ураган «Милтон», который грозит разрушить США? Что за ураган «Милтон», который грозит разрушить США?

Ураган «Милтон» уже назвали самым разрушительным за столетие

Maxim
Что полезнее: начос или чипсы? Узнайте ответ и делайте правильный выбор! Что полезнее: начос или чипсы? Узнайте ответ и делайте правильный выбор!

Почему вам стоит выбрать начос вместо картофельных чипсов?

ТехИнсайдер
Сэкономьте на химчистке! Вот что нужно знать для стирки пальто и пуховика в домашних условиях Сэкономьте на химчистке! Вот что нужно знать для стирки пальто и пуховика в домашних условиях

Как постирать зимнюю верхнюю одежду дома?

ТехИнсайдер
Иваново: А что вокруг? Иваново: А что вокруг?

Какие сокровища таит в себе Ивановская область

КАНТРИ Русская азбука
Тока этого мало Тока этого мало

Электроэволюция в одной отдельно взятой стране

Автопилот
5 американских автопроизводителей, которые строили танки 5 американских автопроизводителей, которые строили танки

Автомобильные компании, которые во времена мировых войн начали выпускать танки

4x4 Club
Инновации решают Инновации решают

Каким окажется будущее российской экономики

Деньги
Многоликий Ян Многоликий Ян

Ян Гинзбург: разархивирование настоящего

Weekend
Загадки Иеремии Позье: как в Эрмитаже реставрируют исторические драгоценности Загадки Иеремии Позье: как в Эрмитаже реставрируют исторические драгоценности

Из чего состоят реставрационные процессы в Эрмитаже и кто за них в ответе

Forbes
Худеем по интуиции Худеем по интуиции

Надо ли заставлять себя есть брокколи и шпинат, если к ним не лежит душа?

Лиза
Северный полюс – 2024. Новые рекорды Северный полюс – 2024. Новые рекорды

В июле 2024 г. Федор Конюхов и Игорь Потапкин путешествовали к Северному полюсу

Наука и техника
Открыть в приложении