Владимир Васильев – о влиянии больших языковых моделей на будущее человека

РБКHi-Tech

Владимир Васильев: «Гонка технологических «вооружений» уже началась»

Какое влияние на экономику и будущее человека окажет стремительное развитие больших языковых моделей и почему переход к общему искусственному интеллекту по степени влияния на мир сопоставим с изобретением ядерного оружия? Ответы на эти вопросы — в колонке эксперта Владимира Васильева

Автор: Владимир Васильев, исследователь данных, академический руководитель онлайн-магистратуры Skillfactory и ТГУ «Анализ естественного языка в лингвистике и IT»

NLP как средство общения машины и человека

Natural Language Processing, или обработка естественного языка, — это одна из трех основных областей знаний в науке о данных. Две другие области — классическое машинное обучение (Machine Learning) и компьютерное зрение (Computer Vision). Многие называют эти области искусственным интеллектом, хотя специалисты предпочитают термин Data Science.

С использованием NLP-технологий построены все виртуальные ассистенты, которых вы знаете: «Алиса», «Маруся», «Салют» и многие другие. А также все большие языковые модели вроде ChatGPT, Bard, LLaMa или GigaChat. NLP-алгоритмы обрабатывают текстовые данные, которые накопились в процессе использования человеческого языка. Все то, что мы произносим, пишем, печатаем и слышим, можно привести к текстовому формату и обработать с помощью NLP-алгоритмов.

Большие языковые модели: от кладезя знаний до генератора фейков

Современные GPT-подобные модели представляют собой класс больших языковых моделей (LLM, Large Language Models) на основе трансформерной архитектуры, которые еще называют генеративными нейросетями. Основным элементом трансформерной архитектуры является механизм внимания (Attention Mechanism), который позволяет модели фокусироваться на наиболее важных элементах последовательности текста при его обработке. У современных LLM большое число параметров. Например, GPT-3 (модель из семейства GPT) содержит 175 млрд параметров, а T5 (Text-to-Text Transfer Transformer) — более чем 11 млрд параметров.

Параметры модели — это множество весовых коэффициентов, которые изменяются и оптимизируются в процессе обучения модели. Итоговые значения этих параметров являются результатом обучения модели — они определяют, как модель обрабатывает и генерирует информацию. Считается, что языковая модель является большой, если содержит больше одного миллиарда параметров.

Современные большие языковые модели смогут «поговорить» с вами человеческим языком, помогут найти информацию из интернета или написать компьютерный код, а также сформулируют правдоподобный ответ. Неудивительно, что такие не виданные ранее способности современных LLM впечатлили за минувший год многих пользователей и подогрели интерес к ИИ во всем мире.

Однако LLM опираются в основном на знания, которые им «скормили» во время обучения, и используют базовые логические операции с доступной информацией, поэтому их ответ не всегда будет полным или полностью верным. Кроме того, модель может по-разному отвечать на один и тот же вопрос и даже галлюцинировать, то есть выдавать за факт попросту не соответствующую действительности информацию.

Например, ChatGPT в ответ на запрос о конкретном человеке может выдумать несуществующую биографию, приукрасив ее различными ложными фактами. Такое поведение больших языковых моделей повышает риски их использования в тех отраслях, где цена ошибки особенно высока.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Колода джокеров и сорок сценариев будущего Колода джокеров и сорок сценариев будущего

Прогнозист Александр Чулок — о том, по какому пути может пойти развитие общества

РБК
Современная сказка Востока Современная сказка Востока

Крупнейший из семи Арабских Эмиратов, Абу-Даби, любит быть первым во всем

Лиза
Ирина Калабихина: «Демографический взрыв уже у нас за спиной» Ирина Калабихина: «Демографический взрыв уже у нас за спиной»

Экономист Ирина Калабихина — что с нами будет дальше и хватит ли всем места?

РБК
Деконструкция мегаполиса: город в городе Деконструкция мегаполиса: город в городе

Как современное строительство помогает людям быть счастливее

СНОБ
Сергей Шумский: «У роботов не будет инстинкта власти, как у человека» Сергей Шумский: «У роботов не будет инстинкта власти, как у человека»

Минувший год имеет шансы войти в историю как время взрывного роста нейросетей

РБК
Где начинается насилие: 4 варианта взаимодействия с чужими личными границами Где начинается насилие: 4 варианта взаимодействия с чужими личными границами

Где кончается взаимодействие и начинается насилие и как это можно понять

Psychologies
Евгений Колбин: «Мы построили бизнес-процессы вокруг клиента» Евгений Колбин: «Мы построили бизнес-процессы вокруг клиента»

Евгений Колбин рассказал о том, как развиваются облака в России

РБК
Он на свете всех Милей Он на свете всех Милей

На президентских выборах в Аргентине победил Хавьер Милей

Монокль
Рубен Ениколопов: «В вопросах на миллиарды долларов нельзя консультироваться с ChatGPT» Рубен Ениколопов: «В вопросах на миллиарды долларов нельзя консультироваться с ChatGPT»

Рубен Ениколопов: сможет ли Россия в одиночку совершить технологический рывок

РБК
Интересный факт! Ученые рассказали, почему у вас звенит в ушах Интересный факт! Ученые рассказали, почему у вас звенит в ушах

"Фантомный шум" в ушах генерируется гиперактивными нервами

ТехИнсайдер
Кислотность Кислотность

Что мы знаем о кислотности желудочного сока?

Maxim
Мозг новорожденных людей развит не хуже, чем у других приматов Мозг новорожденных людей развит не хуже, чем у других приматов

Мозг новорожденных людей развит не хуже, чем мозг других приматов

ТехИнсайдер
Американские снеки и каши достанутся русскому газировщику Американские снеки и каши достанутся русскому газировщику

Уходящие из России Kellogg и Kraft Heinz продают свои активы «Черноголовке»

Эксперт
Резерфорд и рождение экспериментальной ядерной физики Резерфорд и рождение экспериментальной ядерной физики

Первое искусственное превращение химических элементов

Наука и жизнь
Настоящий имперец Настоящий имперец

Ни один другой немецкий политик не был использован так сильно, как Бисмарк

Дилетант
Гиганты растительного мира Гиганты растительного мира

Эти деревья видели динозавров и смогли пережить ледниковый период

Зеркало Мира
«Мода — это язык мира» «Мода — это язык мира»

Карина Нигай о пути в моду, любимых брендах и новых целях

OK!
Арт-субъект: где на Урале рождается современное искусство Арт-субъект: где на Урале рождается современное искусство

Как актуальное искусство будет развиваться в России

СНОБ
Кодекс постороннего Кодекс постороннего

Как Альбер Камю обнаружил, что жизнь не имеет смысла — и нашел, зачем стоит жить

Weekend
От «золотой клетки» к art of living От «золотой клетки» к art of living

Как изменились ценности покупателя элитной недвижимости за 30 лет

РБК
«Уходи, Тейлор Свифт»: что нас бесило в музыке в 2023 году «Уходи, Тейлор Свифт»: что нас бесило в музыке в 2023 году

Музыка, которую с удовольствием можно оставить бы в 2023 году

Правила жизни
Станция «Динамо» Станция «Динамо»

Анекдоты про жен, отлынивающих от секса, пора переписывать

Добрые советы
Простуда в условиях невесомости: может ли человек заболеть в космосе Простуда в условиях невесомости: может ли человек заболеть в космосе

Почему в условиях невесомости намного тяжелее переносить болезни

ТехИнсайдер
Хождение по мухам Хождение по мухам

Как испортился квартирный вопрос и что с этим делать

Weekend
Теория вырождения: вниз по лестнице, ведущей вверх Теория вырождения: вниз по лестнице, ведущей вверх

«Раньше было лучше», или «Золотой век» и теория вырождения

Знание – сила
Уи, шеф! Уи, шеф!

Сверхпопулярный светский спот — морское бистро Crevette

Собака.ru
Итоги-2023 Итоги-2023

Уходящий год был насыщен событиями, и вот некоторые из них

Агроинвестор
Человек исправленный и дополненный Человек исправленный и дополненный

Что лежит в основе генетических чудес и как сделать их доступными для всех?

Robb Report
Слишком дорого и неоднозначно. Тест-драйв Volkswagen Taos 4 Motion Слишком дорого и неоднозначно. Тест-драйв Volkswagen Taos 4 Motion

Почему маленький кроссовер Volkswagen не может привлечь покупателей

4x4 Club
Плоды ошибок трудных Плоды ошибок трудных

Государство усиливает регулирование в сфере абортов

Монокль
Открыть в приложении