Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Тренд золотых девочек»: как женщины ищут компаньонок для совместной жизни на пенсии «Тренд золотых девочек»: как женщины ищут компаньонок для совместной жизни на пенсии

Женские коммуны вместо домов престарелых — как женщины борются с одиночеством

Forbes
Пять cамых громких терактов, за которые никто не взял ответственность Пять cамых громких терактов, за которые никто не взял ответственность

Последние четверть века теракты все чаще совершают анонимные группы

Maxim
«Мы не боимся, рынок большой»: экспорт удобрений вырос на фоне европейских пошлин «Мы не боимся, рынок большой»: экспорт удобрений вырос на фоне европейских пошлин

Почему российские удобрения выглядят пока неуязвимыми для санкций

Forbes
Замещение строптивого Замещение строптивого

Инвесторы получили локальную альтернативу заблокированным еврооблигациям

Деньги
Эта привычка может повысить риск развития деменции на 43% Эта привычка может повысить риск развития деменции на 43%

Употребление большого количества сахара может повысить риск развития деменции

ТехИнсайдер
Совсем не соринка Совсем не соринка

Лечение конъюнктивита и что делать, чтобы он не появился снова

Лиза
Сколько можно зудеть! Сколько можно зудеть!

Почему зимой у некоторых из нас начинает сильно чесаться кожа?

Лиза
Азы Таро: что нужно знать, чтобы твоя колода не пылилась на полке Азы Таро: что нужно знать, чтобы твоя колода не пылилась на полке

Что нужно знать, чтобы прибегать к помощи карт самостоятельно

VOICE
Идиот на службе Идиот на службе

Краткая история бравого солдата Швейка в 25 пунктах

Weekend
Ученый предложил простое научное объяснение случаям встречи человека и йети Ученый предложил простое научное объяснение случаям встречи человека и йети

Кого люди видели в темном лесу: йети или просто медведя?

ТехИнсайдер
История символов знаков зодиака История символов знаков зодиака

Неочевидные смыслы и зашифрованные послания знаков зодиака

Лиза
Могут ли собаки испытывать эмоции Могут ли собаки испытывать эмоции

Что мы знаем об эмоциях собак?

ТехИнсайдер
Одна вокруг света: забастовка на шоссе и сосновая живица по дороге в Аргентину Одна вокруг света: забастовка на шоссе и сосновая живица по дороге в Аргентину

204-я серия о кругосветном путешествии москвички Ирины Сидоренко

Forbes
Ртуть, тюрьма и пиявки: как лечили половые инфекции в Средние века Ртуть, тюрьма и пиявки: как лечили половые инфекции в Средние века

Раньше половые инфекции считали отвратительными

ТехИнсайдер
Почему спать днем полезно: 2 главные причины — узнайте, как делать это правильно Почему спать днем полезно: 2 главные причины — узнайте, как делать это правильно

Зачем спать днем?

Psychologies
Не могу сказать «прости» Не могу сказать «прости»

Как правильно просить прощения?

Лиза
Народный альтист Народный альтист

Юрий Башмет о коллекционировании, великих друзьях и о концертах в день рождения

Robb Report
Никакой магии, только психология: как имя влияет на твою судьбу Никакой магии, только психология: как имя влияет на твою судьбу

Хочешь узнать, как на тебя повлияло твое имя?

VOICE
Черное золото на Крайнем Севере: как добывают нефть в Арктике Черное золото на Крайнем Севере: как добывают нефть в Арктике

Нефтедобывающая платформа «Приразломная», работающая на шельфе, уникальна

Вокруг света
Держись подальше: эти 6 продуктов вызывают неконтролируемую тягу и заставляют тебя набирать вес Держись подальше: эти 6 продуктов вызывают неконтролируемую тягу и заставляют тебя набирать вес

Против этой триггерной еды не устоит и самая прокачанная сила воли

VOICE
35 вопросов, которые помогут вам лучше узнать близкого человека 35 вопросов, которые помогут вам лучше узнать близкого человека

Часто нам кажется, что о самых близких нам людях мы знаем буквально все

Psychologies
Владимир Чистяков: Работа на кухне — это как вытачивать подшипники, работа на износ Владимир Чистяков: Работа на кухне — это как вытачивать подшипники, работа на износ

Интервью с ресторатором Владимиром Чистяковым

СНОБ
NFT, портрет собаки и береза с мантрами: что покупают молодые коллекционеры NFT, портрет собаки и береза с мантрами: что покупают молодые коллекционеры

Что за работы покупают молодые коллекционеры и зачем

Forbes
Разрешать ли 9-летнему ребенку спать с родителями? Или пора взрослеть? Мнение Разрешать ли 9-летнему ребенку спать с родителями? Или пора взрослеть? Мнение

Можно ли делать исключения при воспитании детей?

ТехИнсайдер
6 фильмов и сериалов о взаимоотношениях психотерапевтов и их пациентов 6 фильмов и сериалов о взаимоотношениях психотерапевтов и их пациентов

Сериалы и фильмы, которые позволят заглянуть в кабинет психотерапевта

Psychologies
Ученые случайно создали уникальный тип льда с аномальными свойствами: впервые на Земле Ученые случайно создали уникальный тип льда с аномальными свойствами: впервые на Земле

Ученые создали лед с плотностью почти такой же, как у жидкой воды

ТехИнсайдер
Обновлённый BMW X5 против обновлённого Mercedes-Benz GLE Обновлённый BMW X5 против обновлённого Mercedes-Benz GLE

Два извечных соперника обновлены для 2024 модельного года

4x4 Club
Реальная любовь: 8 фильмов о том, какими бывают чувства Реальная любовь: 8 фильмов о том, какими бывают чувства

Киноподборка ко Дню всех влюбленных для тех, кто сказкам предпочитает быль.

Правила жизни
Почему мужчины не любят говорить о своих чувствах? Почему мужчины не любят говорить о своих чувствах?

Как избавить партнера от страха признаваться в чувствах?

Psychologies
Чистая монета Чистая монета

Что если инвестировать в деньги? Хорошая идея, если речь о коллекционных монетах

Robb Report
Открыть в приложении