Новый способ оптимизации предварительного обучения Больших языковых моделей

ТехИнсайдерHi-Tech

Разработан более дешевый способ обучения Больших языковых моделей

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы. Это позволит значительно удешевить разработку Больших языковых моделей и сделать их создание более доступным независимым разработчикам.

Владимир Губайловский

ce9cebf76db8bc7877647f1250420a14_ce_1974x1316x0x83.jpg
Unsplash.com. DeepMind

Цель таких работ — сделать Большие языковые модели (такие как GPT), требующие миллионы на обучение, работающие на мощнейших компьютерах с огромными дата-центрами, доступными на домашнем компьютере или смартфоне. И разработчики двигаются в этом направлении.

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы.

ChatGPT и другие приложения, использующие Большие языковые модели (LLM), находят все более широкое применение и привлекают пристальное внимание СМИ. Однако в сфере LLM доминируют несколько крупных технологических компаний, поскольку предварительное обучение этих моделей является чрезвычайно дорогостоящим процессом: стоимость начинается с 10 миллионов долларов. Сколько стоило обучение GPT не сообщается, но оценить его в миллиард долларов не будет серьезным преувеличением.

«Большие языковые модели не очень-то доступны для небольших организаций или академических групп», — говорит Хонг Лю, аспирант факультета информатики Стэнфордского университета.

Чтобы изменить ситуацию, Лю и его коллеги решили усовершенствовать существующие методы оптимизации LLM. В результате был разработан подход под названием Sophia, который сокращает время предварительного обучения вдвое. 

Оптимизация оптимизации

507231df3ff536c824bc47835115b915.jpg
Unsplash.com. DeepMind

Чтобы оптимизировать предварительное обучение LLM ученые использовали два приема. Первый, известный как оценка кривизны, не нов, но команда Стэнфорда нашла способ сделать его более эффективным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему евреи мигрировали в США и стали важной частью американской культуры Почему евреи мигрировали в США и стали важной частью американской культуры

Миграция евреев в США оказала значительное влияние на развитие культуры

ТехИнсайдер
Неудобный разговор: как подготовиться и донести мысль — 4 правила Неудобный разговор: как подготовиться и донести мысль — 4 правила

Как не утратить взаимопонимание и доверие при обсуждении сложных вопросов

Psychologies
Что делают пилоты, если самолет попадает в зону турбулентности: неожиданный ответ Что делают пилоты, если самолет попадает в зону турбулентности: неожиданный ответ

Может ли тряска привести к авиакатастрофе?

ТехИнсайдер
4 книги о цифровой индустрии и ее влиянии на человека 4 книги о цифровой индустрии и ее влиянии на человека

Книги, которые помогут разобраться в истории возникновения цифровой эры

СНОБ
Творческий поток: почему лучшие идеи приходят к нам в самых неожиданных ситуациях Творческий поток: почему лучшие идеи приходят к нам в самых неожиданных ситуациях

Что такое «блуждание ума» и почему оно помогает найти неожиданные решения

Forbes
Люди потерпели боль ради бесполезной информации Люди потерпели боль ради бесполезной информации

Ученые узнали, что люди готовы терпеть боль ради избегания неизвестности

N+1
Что будет с «автоматом», если придется буксировать автомобиль Что будет с «автоматом», если придется буксировать автомобиль

Почему нельзя буксировать машину с АКП?

Maxim
Одичавшие норки восстановили уменьшившийся из-за одомашнивания относительный объем мозга Одичавшие норки восстановили уменьшившийся из-за одомашнивания относительный объем мозга

Относительный размер мозга одичавших норок почти вернулся к прежним показателям

N+1
Палеонтологи описали древнего аллигатора из Таиланда Палеонтологи описали древнего аллигатора из Таиланда

Описан вид аллигаторов, который жил на территории Таиланда 230 тысяч лет назад

N+1
Настоящая женщина: как вредят стереотипы — интервью психолога Настоящая женщина: как вредят стереотипы — интервью психолога

Почему современные женщины слишком зависят от мужского мнения?

Psychologies
Закончилась память на телефоне? Есть способ освободить гигабайты места без удаления файлов! Закончилась память на телефоне? Есть способ освободить гигабайты места без удаления файлов!

Как же очистить место на смартфоне, не потеряв важные данные?

ТехИнсайдер
И любимая подпись — «Ильич» И любимая подпись — «Ильич»

Маргарита Фофанова — одна из любимейших женщин Ленина

Дилетант
Астрономы впервые увидели, как рождаются газовые гиганты, подобные Юпитеру Астрономы впервые увидели, как рождаются газовые гиганты, подобные Юпитеру

Ученые смогли лучше понять процесс формирование огромных газовых гигантов

ТехИнсайдер
Жестко, гибко, долгосрочно Жестко, гибко, долгосрочно

Долгосрочные контракты прочно закрепились в российской экономике

Эксперт
«Научиться держать слово»: советы от богатейших инвесторов мира «Научиться держать слово»: советы от богатейших инвесторов мира

Как разжиться достаточным богатством, чтобы попасть в список Forbes?

Forbes
Уроки стартаповедения: о чем не стоит забывать тем, кто запускает свой проект Уроки стартаповедения: о чем не стоит забывать тем, кто запускает свой проект

Как удержать свой стартап на плаву и сделать его успешным?

Forbes
Как найти потерянный Android-смартфон: несколько простых способов Как найти потерянный Android-смартфон: несколько простых способов

Как быстро найти потерянный или украденный Android-смартфон своими силами

CHIP
Роботы и люди: как производят материнские платы на заводе в Шуе Роботы и люди: как производят материнские платы на заводе в Шуе

Как устроен завод по изготовлению материнских плат

СНОБ
«Сон — лекарство от голода»: как выживают женщины, лишенные своего дома «Сон — лекарство от голода»: как выживают женщины, лишенные своего дома

Глава из повести «Плавильная лодочка» — о судьбах женщин при депортациях

Forbes
«Изобретение прав человека: история» «Изобретение прав человека: история»

Как в обществе менялось восприятие пыток

N+1
Страна гор: что посмотреть в Дагестане Страна гор: что посмотреть в Дагестане

Куда ехать и что смотреть в Дагестане

Правила жизни
Слитые нюдсы и непрошенные дикпики: что нужно знать подростку о секстинге в интернете Слитые нюдсы и непрошенные дикпики: что нужно знать подростку о секстинге в интернете

Как принимать решения, связанные с сексом — в том числе обозначать свои границы?

Psychologies
Почему Толстой не имел права бросать Анну Каренину под поезд Почему Толстой не имел права бросать Анну Каренину под поезд

Мария Микулина написала новую книгу под названием «Женщина на пике мозга»

Maxim
Тратьте деньги, чтобы сэкономить время: советы от инвестгуру Навала Равиканта Тратьте деньги, чтобы сэкономить время: советы от инвестгуру Навала Равиканта

Как оценить себя правильно и на что стоит тратить время?

Forbes
Инопланетяне в подводных лесах и семейная жизнь зубаток Инопланетяне в подводных лесах и семейная жизнь зубаток

Знакомимся с причудливыми обитателями пролива Сальтстраумен

N+1
Как скрыть недостатки фигуры в летних образах: лайфхаки против Как скрыть недостатки фигуры в летних образах: лайфхаки против

Эти модные трюки помогут скрыть недостатки фигуры

VOICE
Перекрестная иммунореактивность помогла при лечении меланомы Перекрестная иммунореактивность помогла при лечении меланомы

Рецептор, узнающий одновременно три разных опухолевых антигена

N+1
Лунная диета. Прощайте, лишние килограммы Лунная диета. Прощайте, лишние килограммы

Луна управляет не только приливами и отливами в морях и океанах

Лиза
Почему наводнения происходят все чаще: эпоха великих катастроф Почему наводнения происходят все чаще: эпоха великих катастроф

Почему природные катаклизмы стали посещать нас с завидной регулярностью?

Maxim
Когда женщины начали носить лифчики? Интересные факты! Когда женщины начали носить лифчики? Интересные факты!

Бюстгальтер — привычное нижнее белье на пересечении моды и функциональности

ТехИнсайдер
Открыть в приложении