ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

8 полезных свойств орехом макадамия, о которых вы не знали 8 полезных свойств орехом макадамия, о которых вы не знали

Макадамия: чем полезны для организма эти орехи?

ТехИнсайдер
8 признаков, что вы эмпат 8 признаков, что вы эмпат

Чем может обернуться дар эмпатии?

Psychologies
VisionLabs внедрила систему распознавания дипфейков в банках четырех стран VisionLabs внедрила систему распознавания дипфейков в банках четырех стран

VisionLabs внедрил систему обнаружения дипфейков в банки России

Forbes
Ярославль Ярославль

Что должно быть в вишлисте туриста, решившего посетить Ярославль?

КАНТРИ Русская азбука
Леонардо да Винчи. Биография Леонардо да Винчи. Биография

Почему «Джоконда» – шедевр, на который хотят посмотреть вживую миллионы людей

kiozk originals
Дмитрий Суетенков: «Одна из причин неправильного прикуса – то, что люди всё реже используют зубы по назначению: всё меньше и меньше жуют» Дмитрий Суетенков: «Одна из причин неправильного прикуса – то, что люди всё реже используют зубы по назначению: всё меньше и меньше жуют»

Чем коварен неправильный прикус?

Здоровье
Почему капитанский мостик находится в корме, если с носа обзор лучше Почему капитанский мостик находится в корме, если с носа обзор лучше

Где должен быть установлен капитанский мостик — на корме или на носу корабля?

ТехИнсайдер
Страшное будущее. Тест-драйв первого в России Tesla Cybertruck Beast Страшное будущее. Тест-драйв первого в России Tesla Cybertruck Beast

Autonews.ru испытал самый мощный Tesla Cybertruck Beast в мире: плюсы и минусы

РБК
Профессия Профессия

Смешные, дикие и просто увлекательные истории от агентов известных актеров

Правила жизни
Дизайнер Даниил Анциферов про секс, ЗОЖ, диско и свой «план Б» — интервью на «Снобе» Дизайнер Даниил Анциферов про секс, ЗОЖ, диско и свой «план Б» — интервью на «Снобе»

Дизайнер Даниил Анциферов — об инвестициях, диско и патриотизме

СНОБ
Тень учителя Тень учителя

Василий Степанов о Мэгги Смит

Weekend
Фонотека Фонотека

Композиторы, чей вклад в создание киношедевра не уступает режиссерскому

Правила жизни
Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу Палеонтологи описали жившую по соседству с тираннозаврами хищную птицу

Энанциорнис Avisaurus darwini достигал размеров ястреба и хватал добычу лапами

N+1
Вечная нефтяная зависимость Вечная нефтяная зависимость

История «голландской болезни» Венесуэлы

Деньги
Мочевина для дизеля: что это такое и для чего нужна Мочевина для дизеля: что это такое и для чего нужна

Специальная жидкость с малоаппетитным названием раствор мочевины. Для чего она?

РБК
Курс на Восток Курс на Восток

Интерьер как портрет владелицы с учётом принципов древнеиндийской философии

RR Люкс.Личности.Бизнес.
Агродроны облетают российские поля Агродроны облетают российские поля

Как БПЛА помогают сельхозпредприятиям экономить

Агроинвестор
Настоящая мягкая сила Настоящая мягкая сила

«На светлой стороне»: китайская история взросления в семи новеллах

Weekend
От Джона Леннона до королевы Елизаветы: 10 знаменитых кадров фотографа Энни Лейбовиц От Джона Леннона до королевы Елизаветы: 10 знаменитых кадров фотографа Энни Лейбовиц

10 лучших снимков американского фотографа Энни Лейбовиц

Forbes
Что такое адаптивный круиз-контроль и чем он отличается от обычного Что такое адаптивный круиз-контроль и чем он отличается от обычного

Адаптивный круиз-контроль: что за устройство, в чем сильные и слабые стороны?

РБК
«Жертвы» одного хита: как складываются судьбы музыкантов с одной популярной песней «Жертвы» одного хита: как складываются судьбы музыкантов с одной популярной песней

Psychologies вспоминает судьбы нескольких «артистов одного хита»

Psychologies
Китайская доходность: что происходит с облигациями в юанях Китайская доходность: что происходит с облигациями в юанях

Рынок юаневых облигаций мог бы заменить закрытый рынок евробондов

Forbes
9 худших вещей, которые может сделать мастер маникюра 9 худших вещей, которые может сделать мастер маникюра

Что отличает хорошего нейл-дизайнера от плохого?

VOICE
Дорожные «Карты»: почему «Яндекс» чуть не закрыл «Навигатор» Дорожные «Карты»: почему «Яндекс» чуть не закрыл «Навигатор»

В 2021–2022 годах «Яндекс» рассматривал возможность закрытия «Навигатора»

Forbes
Жизнь на Венере может развиваться в серной кислоте Жизнь на Венере может развиваться в серной кислоте

Биомолекулы, липиды, могут сохранять свою структуру в серной кислоте Венеры

ТехИнсайдер
Как мужчины оценивают профили женщин на сайтах знакомств: принцип, о котором тебе надо знать Как мужчины оценивают профили женщин на сайтах знакомств: принцип, о котором тебе надо знать

Когда ты просматриваешь чей-то профиль в дейтинге, на что ты обращаешь внимание?

VOICE
Кострома: Личный опыт Кострома: Личный опыт

Впечатления автотуристов из Москвы, которые приехали в Кострому на уик-энд

КАНТРИ Русская азбука
Как проверить скорость SSD на запись и чтение Как проверить скорость SSD на запись и чтение

Программы для проверки скорости работы твердотельного накопителя

CHIP
Что стало вдохновением для Джокера Хита Леджера? Узнайте о пугающем художнике Фрэнсисе Бэконе! Что стало вдохновением для Джокера Хита Леджера? Узнайте о пугающем художнике Фрэнсисе Бэконе!

Как Фрэнсис Бэкон повлиял на образ Джокера в "Темном рыцаре"?

ТехИнсайдер
Почему нам нравятся истории о привидениях Почему нам нравятся истории о привидениях

Почему людей привлекают страшные истории?

ТехИнсайдер
Открыть в приложении