Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Здоровый симбиоз: почему врачам и айтишникам важно работать в команде Здоровый симбиоз: почему врачам и айтишникам важно работать в команде

Что мешает медикам и «технарям» понять друг друга?

Forbes

Как изменились герои сериала "Бедная Настя"

VOICE
«Пройти процесс самопознания»: как через смыслы найти свою мотивацию в бизнесе «Пройти процесс самопознания»: как через смыслы найти свою мотивацию в бизнесе

Как найти мотивацию и смысл в своей деятельности

Forbes
Гадания на Масленицу: как узнать все о любви, деньгах и будущем Гадания на Масленицу: как узнать все о любви, деньгах и будущем

Масленичная неделя – идеальное время для ритуалов и гаданий

VOICE
Сила воли: что мешает нам добиваться цели Сила воли: что мешает нам добиваться цели

Проблема отсутствия силы воли – в образе жизни, который ее ослабляет

Psychologies
Иван Коршунов: Формулу успеха художника вывести невозможно Иван Коршунов: Формулу успеха художника вывести невозможно

Иван Коршунов — о ситуации на рынке современного искусства

СНОБ
Со всех концов света: стало известно, откуда египтяне получали вещества для создания мумий Со всех концов света: стало известно, откуда египтяне получали вещества для создания мумий

Чтобы жрецы могли бальзамировать тела, требовались долгие и опасные путешествия

Вокруг света
Омега-3. 12 весомых причин ввести их в свой рацион Омега-3. 12 весомых причин ввести их в свой рацион

Сбалансированное питание невозможно без жирных кислот

Лиза
Как выглядел Чебурашка в самой первой книге: ты поразишься, когда узнаешь! Как выглядел Чебурашка в самой первой книге: ты поразишься, когда узнаешь!

В первых книгах Чебурашка выглядел совсем иначе

VOICE
Исследования показывают, что только половине ваших друзей вы реально нравитесь: это правда? Исследования показывают, что только половине ваших друзей вы реально нравитесь: это правда?

На самом деле вы нравитесь только половине ваших друзей. Неужели это так?

ТехИнсайдер
Почему мужчина потерял сексуальный интерес: 7 возможных объяснений — узнайте причину Почему мужчина потерял сексуальный интерес: 7 возможных объяснений — узнайте причину

Наиболее частые причины потери мужского либидо

Psychologies
Раздавленные классики Раздавленные классики

Как хоррор-сериал «Красный состав» проехался по русской литературе

Weekend
ТОП-5 упражнений для похудения ТОП-5 упражнений для похудения

Упражнения для похудения всего тела лучше выполнять в рамках комплекса

Лиза
7 забытых ученых, совершивших переворот в науке. Их открытия приписали другим. А вам знакомы эти имена? 7 забытых ученых, совершивших переворот в науке. Их открытия приписали другим. А вам знакомы эти имена?

Многие гении, кардинально изменившие мир, порой остаются в тени

Вокруг света
Дарья Мороз: «Я человек собранный, но чувствительный и ранимый» Дарья Мороз: «Я человек собранный, но чувствительный и ранимый»

Актриса Дарья Мороз – о персонажах и откровенных сценах в кино

VOICE
Режиссер-однолюб: как Вадим Абдрашитов всю жизнь прожил с одной женой Режиссер-однолюб: как Вадим Абдрашитов всю жизнь прожил с одной женой

Вспоминаем жизнь режиссера Вадима Абдрашитов

VOICE
Замещение строптивого Замещение строптивого

Инвесторы получили локальную альтернативу заблокированным еврооблигациям

Деньги
Любовь по расчёту Любовь по расчёту

Инвестиции в искусство — одна из возможностей диверсифицировать свой портфель

Robb Report
«Рисковать, так одной»: как советская полярница Нина Демме покоряла Арктику «Рисковать, так одной»: как советская полярница Нина Демме покоряла Арктику

Ученая Нина Демме осталась в истории первой профессиональной полярницей

Forbes
«Признаюсь, я в шоке от этих испытаний!»: Глюк’oZa раскрыла секреты шоу «Бьюти Баттл» «Признаюсь, я в шоке от этих испытаний!»: Глюк’oZa раскрыла секреты шоу «Бьюти Баттл»

Наталья Чистякова-Ионова рассказала о своих необычных экспериментах

VOICE
Как одеваться девушкам невысокого роста: советы профессионального стилиста Как одеваться девушкам невысокого роста: советы профессионального стилиста

Гид по стайлингу для Дюймовочек от профессионального стилиста

VOICE
В центре Школы будущего будет стоять ребенок | At the Center of the School of the Future will be the Child В центре Школы будущего будет стоять ребенок | At the Center of the School of the Future will be the Child

Журналист Александр Мурашев — как школа может стать жизненным навигатором

Позитивные изменения
Стратегия поиска работы за границей: что писать, с кем говорить и к чему готовиться Стратегия поиска работы за границей: что писать, с кем говорить и к чему готовиться

Сколько времени занимает поиск работы за границей?

Forbes
«Что подумают люди?»: как перестать подстраиваться под других — включите пофигизм «Что подумают люди?»: как перестать подстраиваться под других — включите пофигизм

Что такое «бюджет пофигизма» и как правильно распоряжаться ресурсами

Psychologies
Народный альтист Народный альтист

Юрий Башмет о коллекционировании, великих друзьях и о концертах в день рождения

Robb Report
Максим Аверин: «Без театра не могу, но и кино обожаю» Максим Аверин: «Без театра не могу, но и кино обожаю»

Для меня театр — не геолокация, а способ путешествия в этом мире

Коллекция. Караван историй
Король внедорожников. Стоит ли покупать подержанный Range Rover? Король внедорожников. Стоит ли покупать подержанный Range Rover?

Ни один автомобиль так не зависит от правильного обслуживания, как Range Rover

4x4 Club
Леонид Гайдай Леонид Гайдай

Вспоминаем интересные факты из биографии гениального режиссера

Лиза
Закат Хаттусы Закат Хаттусы

Почему могущественные хетты покинули свою столицу

N+1
Секреты Секреты

Раскрываем секреты домашней укладки феном

VOICE
Открыть в приложении