ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Подать голос: интервью с Денисом Колесниковым, создателем студии «Кураж-Бамбей» Подать голос: интервью с Денисом Колесниковым, создателем студии «Кураж-Бамбей»

Денис Колесников — о важнейших российских и иностранных сериалах

Правила жизни
Аденоиды: удалять или нет? Аденоиды: удалять или нет?

Единого мнения, нужно ли удалять аденоиды, у врачей до сих пор нет

Лиза
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Что влияет на вашу репутацию? Ученые раскрыли секрет успешного сотрудничества! Что влияет на вашу репутацию? Ученые раскрыли секрет успешного сотрудничества!

Как поддерживать сотрудничество между людьми без опоры на социальные нормы?

ТехИнсайдер
Владимир Владимир

Владимир — особенный город с особенными достопримечательностями

КАНТРИ Русская азбука
СЦБ – как много в буквах этих! Сигнализация, централизация, блокировка – «ГАИ» железной дороги СЦБ – как много в буквах этих! Сигнализация, централизация, блокировка – «ГАИ» железной дороги

СЦБ: как устроена регулировка железнодорожных путей

Наука и техника
Неуниверсальное средство: 8 вещей, которые категорически нельзя чистить пищевой содой Неуниверсальное средство: 8 вещей, которые категорически нельзя чистить пищевой содой

Использовать соду для чистки можно далеко не на всех поверхностях

ТехИнсайдер
Вредно — и точка Вредно — и точка

Что такое трансжиры, и в каких продуктах они содержатся

Лиза
Разбитую чашку можно склеить: 4 урока от пар, которые развелись и снова поженились Разбитую чашку можно склеить: 4 урока от пар, которые развелись и снова поженились

Даже самый болезненный развод не «запирает» наглухо дверь вашей былой любви

Psychologies
Экономике предложили альтернативы Экономике предложили альтернативы

Как возможное ухудшение макроэкономической ситуации повлияет на АПК

Агроинвестор
Искусство соединять Искусство соединять

Пентхаус с нестандартной планировкой и смелыми сочетаниями фактур

SALON-Interior
Стоит ли дружить с бывшим: рассуждения психолога Стоит ли дружить с бывшим: рассуждения психолога

Нужно ли поддерживать связь с тем, кого еще недавно любил?

Psychologies
На чем цвет стоит На чем цвет стоит

Осени к лицу желтый цвет, чего не скажешь о ваших зубах. Как сделать их белыми?

Men Today
«Все совпадения неслучайны»: детективная драма с Кейт Бланшетт о лжи и предубеждениях «Все совпадения неслучайны»: детективная драма с Кейт Бланшетт о лжи и предубеждениях

«Все совпадения неслучайны»: почему этот сериал надо досмотреть до конца

Forbes
Плесень и заломы: какие вещи категорически нельзя хранить в вакуумных пакетах Плесень и заломы: какие вещи категорически нельзя хранить в вакуумных пакетах

Вакуумные пакеты подходят далеко не для всех типов одежды

ТехИнсайдер
Павел Попов. Прыгнуть в свой страх, чтобы победить Павел Попов. Прыгнуть в свой страх, чтобы победить

Почему сегодня модные фильмы и сериалы не обходятся без артиста Павла Попова?

Караван историй
Как хобот слона стал самым невероятным хватательным органом на планете Как хобот слона стал самым невероятным хватательным органом на планете

Главную роль в достижении удивительной гибкости хобота у слонов играют морщины

ТехИнсайдер
Мочевина для дизеля: что это такое и для чего нужна Мочевина для дизеля: что это такое и для чего нужна

Специальная жидкость с малоаппетитным названием раствор мочевины. Для чего она?

РБК
Лекарство от дефицита Лекарство от дефицита

Как повышение производительности труда помогает компенсировать нехватку кадров

Деньги
Москва зодиакальная Москва зодиакальная

Астрологическая карта столицы: выбери свой счастливый район

Лиза
Астероиды стали источником цинка и дали возможность развитию земной жизни Астероиды стали источником цинка и дали возможность развитию земной жизни

Без «нерасплавленных» астероидов на Земле не появилось бы жизни

ТехИнсайдер
Жизнь на Венере может развиваться в серной кислоте Жизнь на Венере может развиваться в серной кислоте

Биомолекулы, липиды, могут сохранять свою структуру в серной кислоте Венеры

ТехИнсайдер
Ростов Великий Ростов Великий

Ростов Великий и его главные богатства

КАНТРИ Русская азбука
Необычайные приключения одной теории Необычайные приключения одной теории

Почему теория Дарвина не дает покоя стольким умам, профессиональным и досужим?

Знание – сила
Женские дела Женские дела

Гинекологические заболевания можно избежать, если вовремя обратиться к врачу

Лиза
Заглянуть за горизонт Заглянуть за горизонт

Тувинская музыка, в которой гармонично сочетаются фольклор и современные веяния

Men Today
Кирилл Гребенщиков Кирилл Гребенщиков

Кирилл Гребенщиков об особенностях игры в сериале «Наследники. Дар крови»

Лиза
Яйцо Яйцо

Почему яйца называют чемпионами завтрака?

Здоровье
Будет вам наукой Будет вам наукой

Семь свежих исследований, чтобы вы держали руку на пульсе актуальных знаний

Men Today
Буржуйка в изразцах Буржуйка в изразцах

Изразцы Ярославля как источник вдохновения для строительства печки на своей даче

КАНТРИ Русская азбука
Открыть в приложении