Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

На память о встрече На память о встрече

Аварии из эпохи СССР, запечатленные на фото

Автопилот
В носочках и под музыку В носочках и под музыку

6 приемов для лучшего секса, доказанные наукой

Лиза
Сон о Соне Сон о Соне

Самая сексуальная солистка самой популярной группы дала нам интервью!

Maxim
Храни меня, мой талисман Храни меня, мой талисман

Как выбрать украшения с пользой для здоровья

Лиза
4 признака того, что вы плохо знакомы с собой 4 признака того, что вы плохо знакомы с собой

Как ни парадоксально, часто мы знаем самих себя лишь поверхностно

Psychologies
Как пчелы делают мед: все секреты процесса получения природного десерта Как пчелы делают мед: все секреты процесса получения природного десерта

Мы все очень любим этот продукт, однако как пчелам удается его получить?

ТехИнсайдер
Они вернулись! Они вернулись!

В Дюссельдорф вернулось почти забытое ощущение яхтенного праздника

Y Magazine
Магазин приложений Aptoide: безопасна ли эта альтернатива Google Play? Магазин приложений Aptoide: безопасна ли эта альтернатива Google Play?

Безопасен ли Aptoide?

ТехИнсайдер
Это вам не мусор! 7 хитрых лайфхаков, как использовать втулки от туалетной бумаги Это вам не мусор! 7 хитрых лайфхаков, как использовать втулки от туалетной бумаги

Картонные втулки действительно могут пригодиться в быту. 7 идей их использования

ТехИнсайдер
Причина 8% всех смертей может быть связана с плохим сном (и речь не только про его недостаток) Причина 8% всех смертей может быть связана с плохим сном (и речь не только про его недостаток)

Недостаток сна влияет на ваше здоровье сильнее, чем вы думали

Inc.
Классический выбор. Toyota Land Cruiser 80, 100 и 105 в качестве тюнинг-донора Классический выбор. Toyota Land Cruiser 80, 100 и 105 в качестве тюнинг-донора

Для каждой конкретной задачи требуется свой внедорожник

4x4 Club
11 фильмов о ядерной угрозе 11 фильмов о ядерной угрозе

Как режиссеры изображали жизнь в ожидании или после катастрофы

Weekend
Даниил Хармс Даниил Хармс

Даниил Хармс: писатель, умер в 1942 году

Правила жизни
«Кит» с Бренданом Фрейзером: как режиссер Аронофски находит силу в правде «Кит» с Бренданом Фрейзером: как режиссер Аронофски находит силу в правде

Почему фильм «Кит» интересен не только как актерский перформанс

Forbes
Российские онлайн-кинотеатры потеряли половину голливудского контента за год Российские онлайн-кинотеатры потеряли половину голливудского контента за год

Онлайн-кинотеатры потеряли за год 50% голливудского контента

Inc.
Перфекционизм, равнодушие, тревога: 9 признаков скрытой депрессии — чек-лист Перфекционизм, равнодушие, тревога: 9 признаков скрытой депрессии — чек-лист

Несколько признаков депрессии, о которых нужно знать

Psychologies
Без стандартов, но по призванию. Является ли оценка проектов и программ профессией? | No Standards, Just Calling. Is Project and Program Evaluation a Profession? Без стандартов, но по призванию. Является ли оценка проектов и программ профессией? | No Standards, Just Calling. Is Project and Program Evaluation a Profession?

Является ли оценка проектов и программ профессией?

Позитивные изменения
Как избавиться от старой техники и не навредить природе Как избавиться от старой техники и не навредить природе

Как можно экологично и выгодно избавиться от ненужной техники?

CHIP
Быстрее гиперзвука: величайший космический рекорд, поставленный крышкой от люка Быстрее гиперзвука: величайший космический рекорд, поставленный крышкой от люка

Нет ничего удивительного в том, что инопланетяне не вступают с нами в контакт

Maxim
5 захватывающих книг в духе «Одни из нас» 5 захватывающих книг в духе «Одни из нас»

Книги с пробирающей атмосферой постапокалипсиса

Maxim
Отцы как дети Отцы как дети

«Солнце мое»: самый нежный фильм 2022 года

Weekend
По следам героев фильма «Чебурашка» По следам героев фильма «Чебурашка»

Маршрут по локациям съемок «Чебурашки»: все их можно посетить за одну поездку!

Лиза
Юаневые бонды Юаневые бонды

Каковы риски облигаций, номинированных в китайской валюте

Деньги
Елена Шевченко Елена Шевченко

Как Елена Шевченко стала главной в Петербурге по пирожным

Собака.ru
Полет на Маркс Полет на Маркс

Авангардистам редко удавалось осуществить свои утопические фантазии на практике

Правила жизни
Новое русское бьюти: кто сейчас формирует отечественную индустрию косметики Новое русское бьюти: кто сейчас формирует отечественную индустрию косметики

На российском рынке косметики произошли значительные изменения

Forbes
«В душе я обыватель» «В душе я обыватель»

Петр Тодоровский о своем фильме «Здоровый человек»

Weekend
Как повысить креативность: советы от маркетолога Nike Как повысить креативность: советы от маркетолога Nike

Креативность — необходимый навык как для повседневной жизни, так и для карьеры

Psychologies
Гитлер. Поход во власть Гитлер. Поход во власть

Человек, создавший Третий рейх, был, несомненно, злым гением

Дилетант
Как пилот Амелия Эрхарт изменила авиацию, а потом загадочно исчезла во время полета Как пилот Амелия Эрхарт изменила авиацию, а потом загадочно исчезла во время полета

Амелия Эрхарт не боялась новых рекордов, даже если это было слишком рискованно

Forbes
Открыть в приложении