ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Симуляция жизни: каким будет мир через несколько лет при развитии цифровых двойников Симуляция жизни: каким будет мир через несколько лет при развитии цифровых двойников

Как будет развиваться рынок цифровых двойников и каким образом изменит мир

Forbes
По следам ушедшей эпохи По следам ушедшей эпохи

Реконструкция уникальной исторической квартиры в стиле ар-нуво

SALON-Interior
Улучшит работу мозга! Вот почему надо есть больше свеклы: интересные факты Улучшит работу мозга! Вот почему надо есть больше свеклы: интересные факты

Почему вам нужно обязательно включить свеклу в свой рацион?

ТехИнсайдер
Моторный допинг: как велоспортсмены незаконно «прокачивают» свой байк Моторный допинг: как велоспортсмены незаконно «прокачивают» свой байк

Допинг в велоспорте: не только для спортсменов, но и для их байков

ТехИнсайдер
«Всю жизнь мне нравилось сочинять истории» «Всю жизнь мне нравилось сочинять истории»

Как любовь к кино определила карьеру режиссера и сценариста Никиты Власова

Правила жизни
Что полезнее: начос или чипсы? Узнайте ответ и делайте правильный выбор! Что полезнее: начос или чипсы? Узнайте ответ и делайте правильный выбор!

Почему вам стоит выбрать начос вместо картофельных чипсов?

ТехИнсайдер
Как проверить скорость SSD на запись и чтение Как проверить скорость SSD на запись и чтение

Программы для проверки скорости работы твердотельного накопителя

CHIP
Почему буксует всегда одно колесо – и еще 3 необычных факта о дифференциале автомобиля Почему буксует всегда одно колесо – и еще 3 необычных факта о дифференциале автомобиля

Дифференциал: что это за устройство, зачем он нужен?

ТехИнсайдер
Владимир Владимир

Владимир — особенный город с особенными достопримечательностями

КАНТРИ Русская азбука
Пицца, суши, роллы: что делает бизнес, чтобы люди заказывали и считали еду модной и необходимой Пицца, суши, роллы: что делает бизнес, чтобы люди заказывали и считали еду модной и необходимой

Как бизнес сохраняет интерес к одним и тем же людям в течении многих лет?

Inc.
«Никто этого не хочет»: возможна ли любовь между раввином и ведущей подкаста о сексе «Никто этого не хочет»: возможна ли любовь между раввином и ведущей подкаста о сексе

«Никто этого не хочет»: этот проект сподвигнет вас поверить в вечную любовь

Forbes
Тайны цирковой династии Кио Тайны цирковой династии Кио

Разобраться в хитросплетениях семейных связей династии Кио очень нелегко

Коллекция. Караван историй
Не только Соболев. Главные предательства в истории футбола Не только Соболев. Главные предательства в истории футбола

Фигу, Тевес, Роналдо, и другие футболисты, перешедшие к ненавистным соперникам

СНОБ
В мыле: краткая история стирки от древнего Вавилона до наших дней В мыле: краткая история стирки от древнего Вавилона до наших дней

Как и чем чистили ткани до того, как начали сыпать белый порошок в лоток машинки

Правила жизни
Все краски бизнеса Все краски бизнеса

В чем отставание от времени красных организаций и каковы перспективы бирюзовых

РБК
Коллекция осень-зима Коллекция осень-зима

Урок пейзажной фотосъемки — чтобы подойти к путешествиям во всеоружии

КАНТРИ Русская азбука
Как сумчатые подделали хищников Как сумчатые подделали хищников

В Южном полушарии у саблезубых кошек были крайне экзотические аналоги

Наука и техника
Любимая дочь диктатора: история Эдды Муссолини — самой опасной женщины Европы Любимая дочь диктатора: история Эдды Муссолини — самой опасной женщины Европы

«Нет смысла вести себя хорошо, если знаешь, что тебя ждет гильотина»

VOICE
«Все совпадения неслучайны»: детективная драма с Кейт Бланшетт о лжи и предубеждениях «Все совпадения неслучайны»: детективная драма с Кейт Бланшетт о лжи и предубеждениях

«Все совпадения неслучайны»: почему этот сериал надо досмотреть до конца

Forbes
Северный путь Северный путь

Какое кино снимается в Якутии, Бурятии и Тыве

Знание – сила
Пережил айсберги и военный конфликт, а утонул прямо в порту: странная история советского теплохода “Башкирия” Пережил айсберги и военный конфликт, а утонул прямо в порту: странная история советского теплохода “Башкирия”

«Башкирия» — что особенного было в этом советском теплоходе?

ТехИнсайдер
10 предметов, которые нельзя чистить средством для мытья стекол (хотя кажется, что можно) 10 предметов, которые нельзя чистить средством для мытья стекол (хотя кажется, что можно)

Каким предметам можно навредить жидкостью для мытья стекол?

VOICE
Один из тех, кто «состарил» университет Один из тех, кто «состарил» университет

Кем был Григорий Тишкин, увеличивший возраст СПбГУ почти на 100 лет

Санкт-Петербургский университет
Африканская пропасть Африканская пропасть

Англо-бурская война как историческая неизбежность

Знание – сила
Выигрышная комбинация: режиссер Никита Власов — о сериале «Комбинация», работе на свадьбах и о том, как он попал в кино Выигрышная комбинация: режиссер Никита Власов — о сериале «Комбинация», работе на свадьбах и о том, как он попал в кино

Режиссер Никита Власов — о проблемах индустрии и об исторических сериалах

Правила жизни
4 шага, чтобы научиться ценить себя и признавать свои достижения 4 шага, чтобы научиться ценить себя и признавать свои достижения

Почему мы не ценим свои успехи и как наконец научиться это делать?

Psychologies
Искусственный отбор: что не так с венчурными фондами в России Искусственный отбор: что не так с венчурными фондами в России

Почему российский венчурный рынок пока существенно отстает от мировых лидеров

Forbes
«Дорожная карта будущего» «Дорожная карта будущего»

Как страны будут разрабатывать устойчивое авиационное топливо

РБК
Джим лежа Джим лежа

Героические истории со съемок первых фильмов великих режиссеров

Правила жизни
Кино Кино

Значимые направления кинематографа, причины их возникновения и заката

Правила жизни
Открыть в приложении