Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Слишком позитивно: почему идея всегда быть в ресурсе не работает в реальной жизни Слишком позитивно: почему идея всегда быть в ресурсе не работает в реальной жизни

Как миф о «ресурсе» создает неоправданные ожидания и двойные стандарты

Forbes
Как быстро уснуть: йога для здорового и крепкого сна — 10 полезных асан Как быстро уснуть: йога для здорового и крепкого сна — 10 полезных асан

Делимся простыми упражнениями, которые помогут лучше спать

Psychologies
Как перестроить компанию, которая не перестраивается Как перестроить компанию, которая не перестраивается

Почему перемены нужны предприятиям?

Inc.
Минутка ностальгии: как выглядели забытые первые жены голливудских красавчиков Минутка ностальгии: как выглядели забытые первые жены голливудских красавчиков

Кто они, первые жены голливудских звезд?

VOICE
Как развить уверенность в себе, если вас воспитывали критикующие родители: 6 шагов Как развить уверенность в себе, если вас воспитывали критикующие родители: 6 шагов

Чем грозят долгие годы жизни с критикующими родителями?

Psychologies
Сонный паралич: болезнь, знак ведьмы или вариант нормы Сонный паралич: болезнь, знак ведьмы или вариант нормы

Сонный паралич: страшное, но достаточно безобидное явление

ТехИнсайдер
Как правильно вмешаться в ссору близких и нужно ли вообще это делать? Как правильно вмешаться в ссору близких и нужно ли вообще это делать?

Если два близких тебе человека поссорились, лучше всего как можно быстрее бежать

VOICE
Отдых в горах: 8 слагаемых успеха Отдых в горах: 8 слагаемых успеха

Важные составляющие качественного отдыха на горнолыжном курорте

СНОБ
Экзотические домашние животные в квартире Экзотические домашние животные в квартире

Отважиться завести домашнее животное непросто, а экзотическое – сложнее вдвойне

Здоровье
Держись подальше: эти 6 продуктов вызывают неконтролируемую тягу и заставляют тебя набирать вес Держись подальше: эти 6 продуктов вызывают неконтролируемую тягу и заставляют тебя набирать вес

Против этой триггерной еды не устоит и самая прокачанная сила воли

VOICE
Ученые случайно обнаружили окаменелый мозг в останках рыбы возрастом свыше 300 миллионов лет — это редчайшая находка Ученые случайно обнаружили окаменелый мозг в останках рыбы возрастом свыше 300 миллионов лет — это редчайшая находка

Каким был мозг древней рыбы?

ТехИнсайдер
Какие разработки представили российские ученые в начале 2023 года Какие разработки представили российские ученые в начале 2023 года

Как семена конопли доберутся до кофеен и как фонарик измеряет уровень стресса

СНОБ
Хорошая машина должна быть танком: первый российский тест-драйв Tank 300 Хорошая машина должна быть танком: первый российский тест-драйв Tank 300

К этому автомобилю вы точно не начнете обращаться «Моя красавица»

ТехИнсайдер
Мнимые интеллектуалы: 12 причин, почему мы считаем людей умнее, чем на самом деле Мнимые интеллектуалы: 12 причин, почему мы считаем людей умнее, чем на самом деле

Что совершенно точно ничего не скажет о вашем IQ

Psychologies
«Песочницы» социальных инвестиций | «Sandboxes» for Social Investments «Песочницы» социальных инвестиций | «Sandboxes» for Social Investments

Как в мире развиваются проекты Social Impact Bonds

Позитивные изменения
Как выглядел Чебурашка в самой первой книге: ты поразишься, когда узнаешь! Как выглядел Чебурашка в самой первой книге: ты поразишься, когда узнаешь!

В первых книгах Чебурашка выглядел совсем иначе

VOICE
Пять cамых громких терактов, за которые никто не взял ответственность Пять cамых громких терактов, за которые никто не взял ответственность

Последние четверть века теракты все чаще совершают анонимные группы

Maxim
«Испанцы, Франко умер»: как закончилась одна европейская диктатура «Испанцы, Франко умер»: как закончилась одна европейская диктатура

Отрывок из книги Александра Баунова «Конец режима» — о смерти Франсиско Франко

Forbes
Почему мы чувствуем себя одиноко: 4 основные причины Почему мы чувствуем себя одиноко: 4 основные причины

Почему нас настигает состояние одиночества и как из него выбраться?

Psychologies
Вещи, которые ни в коем случае не должны попасть в твой базовый гардероб — все совершают эту ошибку! Вещи, которые ни в коем случае не должны попасть в твой базовый гардероб — все совершают эту ошибку!

Даже база баз может подвести

VOICE
Худой мир Худой мир

Переговоры сопровождались драматическими, а временами и курьезными эпизодами

Вокруг света
О чем говорят мужчины: откровенная беседа читателей о любви — 5 историй О чем говорят мужчины: откровенная беседа читателей о любви — 5 историй

Пять мужчин — о встречах, расставаниях, изменах, романах и о любви

Psychologies
Синдром «героя реалити-шоу»: как снимаются программы о преображении — рассказ продюсера Синдром «героя реалити-шоу»: как снимаются программы о преображении — рассказ продюсера

Продюсер рассказывает о закулисье реалити-шоу о преображениях

Psychologies
«Рисковать, так одной»: как советская полярница Нина Демме покоряла Арктику «Рисковать, так одной»: как советская полярница Нина Демме покоряла Арктику

Ученая Нина Демме осталась в истории первой профессиональной полярницей

Forbes
Как проявляется кризис среднего возраста у женщин: 4 сценария и способы их изменить Как проявляется кризис среднего возраста у женщин: 4 сценария и способы их изменить

Как предотвратить кризис среднего возраста?

Psychologies
Жерла планеты Жерла планеты

Действующие вулканы – это двери из огненного подземелья

Вокруг света
Как победить прокрастинацию? Как победить прокрастинацию?

Почему мы постоянно откладываем важные дела на потом?

Здоровье
Реальная любовь: 8 фильмов о том, какими бывают чувства Реальная любовь: 8 фильмов о том, какими бывают чувства

Киноподборка ко Дню всех влюбленных для тех, кто сказкам предпочитает быль.

Правила жизни
Шторм какой силы оторвёт вас от земли и унесёт к лешему? Шторм какой силы оторвёт вас от земли и унесёт к лешему?

Какой ветер опасен лично для вас?

ТехИнсайдер
Мозг кальмара и человека развиваются одинаково, несмотря на то, что их пути разошлись 500 миллионов лет назад Мозг кальмара и человека развиваются одинаково, несмотря на то, что их пути разошлись 500 миллионов лет назад

Основной план развития сложных мозгов может быть одним и тем же у разных видов

ТехИнсайдер
Открыть в приложении