Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как искусственный интеллект обретает лицо и теряет свободу: тренды развития ИИ в России Как искусственный интеллект обретает лицо и теряет свободу: тренды развития ИИ в России

Обоснован ли ажиотаж вокруг ИИ и какие тенденции определят его развитие

Наука
В США питоны терроризируют Флориду. Кому стоит беспокоиться? В США питоны терроризируют Флориду. Кому стоит беспокоиться?

Эксперты поражены количеству больших змей на западном побережье Флориды

ТехИнсайдер
Реальные факты, стоящие за самыми известными мифами в истории Реальные факты, стоящие за самыми известными мифами в истории

Порой за легендами стоят реальные факты и явления

Maxim
Королевство больших зеркал Королевство больших зеркал

В конце 1990-х мир охватил бум строительства огромных телескопов

Наука
7 привычек, которые сохранят здоровье глаз 7 привычек, которые сохранят здоровье глаз

Повседневные привычки влияют на наши глаза гораздо сильнее, чем вы думаете

Новый очаг
Соперники «Весты». Машины дешевле ₽2 млн, которые уже можно купить Соперники «Весты». Машины дешевле ₽2 млн, которые уже можно купить

В России встречаются новые автомобили, готовые составить конкуренцию «Весте»

РБК
«Навеселе» «Навеселе»

Как люди хотели устроить пьянку, но построили цивилизацию

N+1
Может ли человек распознать текст ИИ? Вот к чему надо готовиться в будущем! Может ли человек распознать текст ИИ? Вот к чему надо готовиться в будущем!

Как скоро роботы начнут лишать людей работы?

ТехИнсайдер
Макар Кожухов, заместитель генерального директора Premier: Онлайн-кинотеатры — это новые библиотеки Макар Кожухов, заместитель генерального директора Premier: Онлайн-кинотеатры — это новые библиотеки

Заместитель генерального директора Premier — о герое нашего времени и аналитике

СНОБ
Геотермальная энергетика — от горячих источников до глубинных горячих пород Геотермальная энергетика — от горячих источников до глубинных горячих пород

Заставить работать глубинное тепло Земли непросто и дорого, но затраты окупаются

Наука
Фигура на фоне Холодной войны Фигура на фоне Холодной войны

Как художник Евгений Рухин вел американский образ жизни в застойном Ленинграде

Weekend
Формула жизни Формула жизни

Корейцы уверены, что лапша – символ долголетия, а суп – его гарантия

Вокруг света
Больше алкоголя и наркотиков - больше креативности? Ученые дали исчерпывающий ответ Больше алкоголя и наркотиков - больше креативности? Ученые дали исчерпывающий ответ

Что оказывает большее влияние на художественный результат?

ТехИнсайдер
Как психологические абьюзеры отнимают нашу энергию и деньги Как психологические абьюзеры отнимают нашу энергию и деньги

Почему окружающие высасывают из вас энергию?

Psychologies
Новые лица: пять молодых театральных актеров, за которыми стоит следить Новые лица: пять молодых театральных актеров, за которыми стоит следить

Пять самых интересных новых актеров московской сцены

Forbes
Версальское унижение Версальское унижение

Документ, подписанный в 1919 году в Версале, положил конец Первой мировой войне

Дилетант
11 главных химических элементов, из которых состоит наше тело 11 главных химических элементов, из которых состоит наше тело

Человек — это на 99% кислород, водород, азот, углерод, кальций и фосфор!

ТехИнсайдер
Александр Долгих. Про скорость, концентрацию и количество аварий Александр Долгих. Про скорость, концентрацию и количество аварий

Водить машину не так уж и сложно

4x4 Club
Квартира 22 Квартира 22

История о современной мусульманской женщине — той, что носит дизайнерскую одежду

Seasons of life
Люди больше доверяют игрушечному роботу, чем антропоморфному Люди больше доверяют игрушечному роботу, чем антропоморфному

Почему людей так напрягают антропоморфные роботы?

ТехИнсайдер
Реданы, офники и гики: почему подростки подвержены влиянию субкультур Реданы, офники и гики: почему подростки подвержены влиянию субкультур

Стоит ли родителям беспокоиться, если ребенок стал частью какой-то субкультуры?

Psychologies
И ты, бот: почему в утечке данных пользователей ChatGPT нет ничего удивительного И ты, бот: почему в утечке данных пользователей ChatGPT нет ничего удивительного

OpenAI сообщила об утечке персональных данных пользователей чат-бота ChatGPT

Forbes
5 популярных фильмов и сериалов, которые зародились в YouTube 5 популярных фильмов и сериалов, которые зародились в YouTube

Сериалы по мотивам видеоблогов — самое спорное достижение цивилизации

Maxim
«Я многого хочу от будущего партнера»: признание читательницы и комментарий психоаналитика «Я многого хочу от будущего партнера»: признание читательницы и комментарий психоаналитика

Часто после расставания мы хотим слишком многого от будущего партнера

Psychologies
Стоит ли вести дела с близкими и как избежать проблем, если вы все же решились Стоит ли вести дела с близкими и как избежать проблем, если вы все же решились

Предпринимательство нередко разрушает родственные связи. Как этого избежать?

Psychologies
Образ матери: как он влияет на дочь? Образ матери: как он влияет на дочь?

Как воспитывают детей разные типы матерей?

Psychologies
Спорт в любую погоду: как беговая дорожка может улучшить результаты бега Спорт в любую погоду: как беговая дорожка может улучшить результаты бега

Как беговая дорожка помогает выжать максимум пользы из беговых тренировок

ТехИнсайдер
«Почему мы такие на работе»: отрывок из книги «Почему мы такие на работе»: отрывок из книги

Как условная типологизация людей может помочь улучшить атмосферу в коллективе

СНОБ
Сезонная аллергия: как выявить и вылечить — советы врача аллерголога-иммунолога Сезонная аллергия: как выявить и вылечить — советы врача аллерголога-иммунолога

Какие бывают проявления у сезонной аллергии? Что влияет на ее развитие?

Psychologies
Дженнифер Энистон. «Друзья» навсегда Дженнифер Энистон. «Друзья» навсегда

«Девчонка из соседнего двора» или «Американская любимица»

Караван историй
Открыть в приложении