Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Чем занимались жители Наска в свободное от создания геоглифов время? Чем занимались жители Наска в свободное от создания геоглифов время?

Многогранная культура Наска: геоглифы, многофигурная вышивка и керамика

Наука и техника
«Я понял, каково потерять все деньги» «Я понял, каково потерять все деньги»

Андрей Дороничев — о том, как его стартап пережил крах Silicon Valley Bank

Inc.
2010-е: архивация 2010-е: архивация

Знаковые вещи, определившие облик эпохи 2010–2020 годов, уходят со сцены

Maxim
Перерыв на кофе Перерыв на кофе

7 секретов приготовления кофе, которые знают бариста, а теперь и ты

Лиза
«Хочу управлять электропоездом!» Спецрепортаж к 8 Марта «Хочу управлять электропоездом!» Спецрепортаж к 8 Марта

Истории наших героинь, которые работают помощниками машиниста

Лиза
10 вопросов, которые помогут вам понять цели и построить стратегию карьерного роста 10 вопросов, которые помогут вам понять цели и построить стратегию карьерного роста

Умение задавать правильные вопросы — одна из ключевых компетенций коуча

Psychologies
УАЗ «Профи». Полноприводная полуторка УАЗ «Профи». Полноприводная полуторка

Тестируем УАЗ «Профи»

4x4 Club
Ужас и красота Ужас и красота

Почему некоторые воспринимают бабочек символом невыразимого ужаса

Вокруг света
Балаяж: 9 вариантов окрашивания волос и советы экспертов по уходу Балаяж: 9 вариантов окрашивания волос и советы экспертов по уходу

Одна из самых популярных техник осветления

РБК
Кирилл Гребенщиков: «За пять минут до начала иногда думаю: «Вот бы все отменили и не пришлось выходить на сцену!» Но потом это отступает...» Кирилл Гребенщиков: «За пять минут до начала иногда думаю: «Вот бы все отменили и не пришлось выходить на сцену!» Но потом это отступает...»

Популярность — это результат, а для меня всегда важен процесс

Караван историй
Тайна крушения Ту-104 в Пушкине: кто виноват в гибели всего командования Тихоокеанского флота? Тайна крушения Ту-104 в Пушкине: кто виноват в гибели всего командования Тихоокеанского флота?

Почему результаты расследования катастрофы Ту-104 держали в тайне?

ТехИнсайдер
Настроение сканди Настроение сканди

Интерьер квартиры, оформленной в скандинавской эстетике, тяготеет к аскетизму

Идеи Вашего Дома
Вторая половина жизни: истории поздних браков Руперта Мердока и других миллиардеров Вторая половина жизни: истории поздних браков Руперта Мердока и других миллиардеров

Истории миллиардеров, которые решились на новые отношения в зрелом возрасте

Forbes
«Радость науки» «Радость науки»

Важнейшие основы рационального мышления

N+1
Окситоцин помог рыбкам данио-рерио проявить эмпатию к страдающим сородичам Окситоцин помог рыбкам данио-рерио проявить эмпатию к страдающим сородичам

Механизм проявления эмпатии у рыбок похож на аналогичный у млекопитающих

N+1
Гренландия: как живут люди в краю фьордов и вечных льдов Гренландия: как живут люди в краю фьордов и вечных льдов

Чем знаменита Гренландия?

ТехИнсайдер
Агенты паранойи Агенты паранойи

Как манга о Холодной войне вскрывает травмы современной Японии

Weekend
Все о модной голливудской «диете» на уколах для диабетиков: риски, побочки и мнение врачей Все о модной голливудской «диете» на уколах для диабетиков: риски, побочки и мнение врачей

Как на самом деле работает и чем «диета» на уколах опасна для здоровых людей

VOICE
«На дне»: факты о Максиме Горьком, которых вы, возможно, не знали «На дне»: факты о Максиме Горьком, которых вы, возможно, не знали

Максим Горький — один из наиболее печатаемых советских писателей

Правила жизни
Немцы сделали порошковое пиво со всеми пивными компонентами Немцы сделали порошковое пиво со всеми пивными компонентами

Правда ли, что порошковое пиво практически неотличимо от обычного?

Maxim
Почему их так называют? Как автопроизводители выбирают имена для электромобилей Почему их так называют? Как автопроизводители выбирают имена для электромобилей

Имя может создать автомобиль, а может его уничтожить

4x4 Club
Эволюция в банках: как Open Banking изменит жизнь каждого Эволюция в банках: как Open Banking изменит жизнь каждого

Как Open Finance изменит нашу жизнь, в своей колонке рассуждает основатель Yango

Forbes
Пивной путч. Фальстарт Пивной путч. Фальстарт

1923 год выдался для Германии очень беспокойным

Дилетант
Цена портрета: сколько стоило увековечить себя на картине Цена портрета: сколько стоило увековечить себя на картине

Как были написаны и в какую сумму оценивались семь известных портретов

Культура.РФ
Мы нашли ответ, куда бежит время и как его остановить! Мы нашли ответ, куда бежит время и как его остановить!

Куда бежит время?

ТехИнсайдер
От наблюдения до любви: 6 этапов принятия себя — пройдите важный путь От наблюдения до любви: 6 этапов принятия себя — пройдите важный путь

Четкая пошаговая стратегия по принятию себя

Psychologies
Знаменитый парадокс Хокинга о черных дырах наконец разрешен: громкое открытие астрофизиков Знаменитый парадокс Хокинга о черных дырах наконец разрешен: громкое открытие астрофизиков

Известный парадокс физика Стивена Хокинга наконец-то может быть разрешен

ТехИнсайдер
Все 78 удовольствий! Все 78 удовольствий!

Интересные ощущения охватывают, когда поднимаешься на борт флагмана Settantotto

Y Magazine
Вложись по минимуму Вложись по минимуму

Как стать инвестором, даже если в кармане всего 500 рублей

Лиза
Час расплаты: истории трех девушек, которые попали в кредитную кабалу Час расплаты: истории трех девушек, которые попали в кредитную кабалу

Взяла один кредит, потом другой, а дальше долги стали множиться

VOICE
Открыть в приложении