Темная лошадка

Текст: Екатерина Пономаренко

* Language Processing Unit, или языковой процессор. Предназначен для обсчета языковых моделей, например GPT-4.

Как работает языковая модель

Играть на фортепиано очень просто: надо лишь нажимать на нужные клавиши в нужный момент. Так и с искусственным интеллектом: нужно всего-то выполнить нужные преобразования с нужными коэффициентами.

Нейросеть — это компьютерная программа, поведение которой определяется значениями ряда числовых параметров (их также называют коэффициентами). Коэффициентов в современных моделях ИИ невероятно много. Их число измеряется миллиардами, а в последней версии GPT-4 количество коэффициентов достигает 1,76 триллиона. Разработчик ИИ задает количество и параметры нейронных слоев, а компьютер подбирает нужные коэффициенты по алгоритму машинного обучения. Этот алгоритм построен на методе проб и ошибок: модель получает входные данные и оценивает полученный результат. Опираясь на величину ошибки, компьютер вносит коррективы в коэффициенты, после чего цикл повторяется заново. Если в процессе обучения удается достичь хороших результатов — коэффициенты фиксируются и модель передают в использование. На этом процесс обучения нейросети (собственно, подбора коэффициентов) считается завершенным.

Во время практического использования ИИ, например общения с ChatGPT или генерации изображений в Midjourney, коэффициенты уже не меняются, иначе гарантировать стабильность результатов было бы невозможно. Как в человеческом мозге нейроны с похожими функциями образуют целые слои нервной ткани, так и в компьютерных нейросетях численные преобразования собираются в последовательные слои. Для удобства слои разделяются на два вида. Первый вид — слои с многомерными матрицами чисел, или тензорами, выражающими линейные преобразования. Второй вид — слои с нелинейными преобразованиями, которые помогают модели выразить более сложные взаимосвязи, но сами по себе довольно просты и не содержат коэффициентов.

Тензоры — это не просто таблицы с числами. Сложение и умножение тензоров происходит по определенным математическим законам, которые позволяют разделять вычисления на множество независимых потоков. Чем эффективнее построен обсчет тензорных операций, тем быстрее работа нейросети. При этом наносекунды, выигранные на логистике данных или синхронизации потоков вычислений, складываются в секунды ожидания пользователем ответа чат-бота, в минуты одного цикла обучения, дни и недели полного обучения нейронки. Решающую роль в этом играют процессоры.

В этой конфигурации чип Groq был добавлен на испытательный стенд Аргонской национальной лаборатории

Чем отличаются CPU и GPU

Самые первые ЭВМ не были рассчитаны на интерактивное взаимодействие: программист подавал на вход пачку перфокарт, ждал какое-то время и получал результат расчета. Такие машины использовались для нахождения интегралов, расчета баллистических таблиц и решения других сложных вычислительных задач. Когда появились клавиатура, мышь и другие периферийные устройства для ввода информации, процессоры пришлось адаптировать под более гибкую работу.

Так внутри центральных процессоров (CPU) появились дополнительные модули, такие как кэш памяти нескольких уровней, высокопропускная шина данных, маршрутизаторы. Дирижирование этими компонентами и синхронизация процессов обеспечивается на уровне «железа». Это упрощает разработку обычных программ и обеспечивает для них быстродействие, но делает время выполнения любой операции непредсказуемым.

В течение многих лет CPU занимались всеми расчетами от положения курсора на экране до орбитальной траектории МКС, и небольшие проволочки с их стороны никого не смущали. Но когда появилась необходимость совершать огромное количество простых математических операций подряд, задержки стали накапливаться и мешать пользователям. Особенно заметно это стало в середине 1990-х в период бурного роста игровой индустрии. Возможностей CPU стало не хватать для рендеринга — отрисовки кадров для 3D-игр. Рендеринг строится на физических законах оптики и проективной геометрии: линейное движение света, проекция на плоскую пленку объемного изображения и так далее. И все эти расчеты описываются двумерными матрицами чисел.

Темная лошадка

Как работает языковая модель

Чем отличаются CPU и GPU

Рекомендуемые статьи

О демографии и перспективах российских регионов в условиях неопределенности

Взрослые дети, инфантильные родители

О быте и нравах, царящих в московской коммуналке в конца 1980-х

Отрывке из книги корееведа Андрея Ланькова «Не только кимчхи»

Существует ли любовная телепатия?

Глеб Панфилов как режиссер житий

Как долгожданный экшен британского режиссера пытается развлекать зрителя

Для меня все проекты являются самыми психологически и физически затратными

Что добавить в воду для мойки окон, чтобы сэкономить деньги на моющих средствах?

Художник Никита Макаров — как прикладное искусство преображает повседневность

Отложенная жизнь превращается из отложенных на будущее планов в призрачные мечты

Караченцов был невероятно демократичным, как бы свой парень, душа нараспашку

Шесть важных фраз, которые родители могут (и должны) сказать повзрослевшим детям

Донорство крови: главные факты, которые важно знать

Актерская карьера экс-футболиста Дэвида Бекхэма

Введение CSL112 не приводит к снижению риска инфаркта миокарда

Как разговорное кино, в котором нет действия, оказывается напряженной драмой

Каким человеком был парфюмер Эрнест Бо?

Близкие друзья откровенно о Николае Караченцове

Как решить, какую стройку считать великой, а какую нет?

Azimut Fly 72 — авангардная моторная яхта от итальянского бренда

Как воспитывать ребенка, если он вундеркинд?

Отчего все так любят ретроигры и так ли важна для их популярности ностальгия?

Часто думаю, что то, чем я занимаюсь, не моя профессия

Как даже хорошо скрываемая уязвимость мешает принимать верные решения

Как социальные сети влияют на нашу самооценку?

Я попала в счастливую обойму любимых рязановских актеров

Книга казахской писательницы Алтынай Султан об опыте беременности

Как сделать сайт бесплатно, даже если у вас нет никаких навыков в кодинге

«Претенденты»: чего не хватило этой истории о любовном треугольнике на корте