Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Эволюция языковых моделей

Плюсы и минусы нового движка

Рекомендуемые статьи

Основные причины, почему у тебя нет кубиков пресса

Существует ли некое «хорошее» законодательство об иноагентах?

Кто эта хрупкая блондинка? Модель? Актриса? А вот и нет!

Как Гизелла Перл решила помочь беременным узницам концлагеря

Как лягушкам удается возвращаться к жизни после «превращения в ледышки»?

Сосудистый хирург рассказывает, что влияет на здоровье артерий

Как привить ребенку любовь к чтению?

IKEA добилась гендерного равенства среди руководителей на международном уровне

Истории миллиардеров, которые решились на новые отношения в зрелом возрасте

Вероятно, ихтиозавры заселили море еще до великого вымирания

Предубеждения и традиции не помеха на пути к должности CEO в любимой профессии

Культовые картины также могут стать отличным руководством по управлению командой

Удивительные предметы из коллекции музыканта Николая Голованова

Комиксы о Тинтине принесли Эрже не только всемирную славу

Ученые до сих пор не понимают, от чего зависят формы песчаных дюн

Авангардистам редко удавалось осуществить свои утопические фантазии на практике

Каковы шансы обрести в Эмиратах близкие отношения и построить семью?

Чему Дженне Ортеге училась для роли и как снимали сцены с отрубленной рукой?

Искусствовед рассказывает, по какой схеме развивался русский авангард

Документ, подписанный в 1919 году в Версале, положил конец Первой мировой войне

Вспомним самые классные рекламные ролики из 90-х и нулевых. Что стало с героями?

Что входит в задачи наставника?

Какой поговоркой можно охарактеризовать русский народ?

Сериалы, где женщины-адвокаты являются если не основными, то важными персонажами

Райан Бреслоу ввязался в судебное разбирательство по поводу предполагаемой кражи

Газета ещё может пригодиться в быту и стать незаменимым помощником!

Олег Липовецкий — о творческом пути, региональных театрах и сценической правде.

Фигуристка Евгения Медведева выступила с редкими откровениями

Как глобальное потепление влияет на наводнения?

Мы все очень любим этот продукт, однако как пчелам удается его получить?