Новый способ оптимизации предварительного обучения Больших языковых моделей

ТехИнсайдерHi-Tech

Разработан более дешевый способ обучения Больших языковых моделей

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы. Это позволит значительно удешевить разработку Больших языковых моделей и сделать их создание более доступным независимым разработчикам.

Владимир Губайловский

ce9cebf76db8bc7877647f1250420a14_ce_1974x1316x0x83.jpg
Unsplash.com. DeepMind

Цель таких работ — сделать Большие языковые модели (такие как GPT), требующие миллионы на обучение, работающие на мощнейших компьютерах с огромными дата-центрами, доступными на домашнем компьютере или смартфоне. И разработчики двигаются в этом направлении.

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы.

ChatGPT и другие приложения, использующие Большие языковые модели (LLM), находят все более широкое применение и привлекают пристальное внимание СМИ. Однако в сфере LLM доминируют несколько крупных технологических компаний, поскольку предварительное обучение этих моделей является чрезвычайно дорогостоящим процессом: стоимость начинается с 10 миллионов долларов. Сколько стоило обучение GPT не сообщается, но оценить его в миллиард долларов не будет серьезным преувеличением.

«Большие языковые модели не очень-то доступны для небольших организаций или академических групп», — говорит Хонг Лю, аспирант факультета информатики Стэнфордского университета.

Чтобы изменить ситуацию, Лю и его коллеги решили усовершенствовать существующие методы оптимизации LLM. В результате был разработан подход под названием Sophia, который сокращает время предварительного обучения вдвое. 

Оптимизация оптимизации

507231df3ff536c824bc47835115b915.jpg
Unsplash.com. DeepMind

Чтобы оптимизировать предварительное обучение LLM ученые использовали два приема. Первый, известный как оценка кривизны, не нов, но команда Стэнфорда нашла способ сделать его более эффективным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Строительство на Марсе: как грибы и цианобактерии помогут развитию колоний Строительство на Марсе: как грибы и цианобактерии помогут развитию колоний

Для строительства на Марсе не понадобятся ракеты с рабочими материалами

ТехИнсайдер
Рак щитовидной железы: как не допустить развития болезни — 6 главных правил Рак щитовидной железы: как не допустить развития болезни — 6 главных правил

Как выявить «тихий рак» щитовидной железы на ранней стадии болезни?

Psychologies
Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

Forbes
Диана/Дарья Диана/Дарья

Самая ожидаемая премьера Сontext 2023 — спектакль «Дуо»

Собака.ru
«Тратить — очень круто»: как зумеры ведут себя с деньгами «Тратить — очень круто»: как зумеры ведут себя с деньгами

Как молодые взрослые ищут баланс между тратами и накоплениями

РБК
Оценка социального вклада Благотворительного фонда «Даунсайд Ап» | Social Impact Assessment by the Downside Up Charitable Foundation Оценка социального вклада Благотворительного фонда «Даунсайд Ап» | Social Impact Assessment by the Downside Up Charitable Foundation

Как фонд «Даунсайд Ап» повлиял на качество жизни людей с синдромом Дауна

Позитивные изменения
«Ты сама этого хотела!»: как проекции отравляют отношения «Ты сама этого хотела!»: как проекции отравляют отношения

Привычка приписывать другому свои мысли может помешать нам быть счастливыми

Psychologies
Работа над ошибками Работа над ошибками

Попытки сэкономить в бьюти-индустрии оборачиваются неприятностями

Лиза
Новый Mitsubishi L200 наконец-то представлен официально Новый Mitsubishi L200 наконец-то представлен официально

Шестое поколение Mitsubishi L200 получило новый дизель и коробку передач

4x4 Club
Сериал «Медведь»: почему открытие ресторана — это полное безумие и осмысленный хаос Сериал «Медведь»: почему открытие ресторана — это полное безумие и осмысленный хаос

Сериал «Медведь»: как поддержка и любовь близких могут повлиять на бизнес

Forbes
Ужин подан! Ужин подан!

9 вопросов о правильном ужине

Лиза
7 аудиокниг для совместного прослушивания с детьми 7 аудиокниг для совместного прослушивания с детьми

Озвученные уютные произведения для семейных вечеров

СНОБ
Что общего между фольклором и стрит-артом. Отвечают современные художники Что общего между фольклором и стрит-артом. Отвечают современные художники

Как связаны между собой стрит-арт и фольклор?

СНОБ
От укачивания в транспорте можно использовать специальные очки! Вот как они работают От укачивания в транспорте можно использовать специальные очки! Вот как они работают

Необычный способ, который спасет ваш будущий отпуск

ТехИнсайдер
Мода на седаны Мода на седаны

Как марка Omoda повлияла на любовь к седанам

Автопилот
Люди с протезами почувствовали температуру с помощью тонкопленочного охладителя Люди с протезами почувствовали температуру с помощью тонкопленочного охладителя

Охладитель, с помощью которого люди с протезами могут чувствовать температуру

N+1
Средство от хаоса Средство от хаоса

Пора переосмыслить цели и само понятие технического прогресса

Деньги
5 увлекательных книг о культуре разных народов 5 увлекательных книг о культуре разных народов

Пять книг, которые рассказывают о культуре разных стран

СНОБ
Трагедия советского вундеркинда: почему Павел Коноплев не стал светилом мировой науки Трагедия советского вундеркинда: почему Павел Коноплев не стал светилом мировой науки

В десять лет Павел Коноплев опубликовал свою первую научную статью

ТехИнсайдер
«Нет слова, чтобы назвать все, что я чувствовала»: Шэрон Стоун о травме свидетеля «Нет слова, чтобы назвать все, что я чувствовала»: Шэрон Стоун о травме свидетеля

Отрывок из автобиографии Шэрон Стоун «Красота жизни, прожитой дважды»

Forbes
Николай Лебедев: Испытание блокбастерами Николай Лебедев: Испытание блокбастерами

История-лекция о том, как снимается современное кино с большими бюджетами

Maxim
Вы и новый партнер пережили развод: как могут складываться отношения — личная история и комментарий психолога Вы и новый партнер пережили развод: как могут складываться отношения — личная история и комментарий психолога

Сколько нужно времени, чтобы залечить душевные раны после развода?

Psychologies
Кровь стынет в жилах: 5 мистических триллеров, которые точно смогут заинтриговать и даже напугать вас Кровь стынет в жилах: 5 мистических триллеров, которые точно смогут заинтриговать и даже напугать вас

5 страшных романов — не исключено, что ночью вам захочется спать со светом

ТехИнсайдер
Почему выпадают Почему выпадают

Почему могут сыпаться свои ресницы и что с этим делать

VOICE
Самцы паутинных клещей содрали кожу с самок Самцы паутинных клещей содрали кожу с самок

Самцы паутинных клещей охраняют самку накануне линьки, чтобы спариться с ней

N+1
Почему современные птицы выжили, когда динозавры вымерли Почему современные птицы выжили, когда динозавры вымерли

Как перья помогли птицам пережить динозавров?

ТехИнсайдер
Мать всех страхов: как избавиться от танатофобии — и надо ли? Мать всех страхов: как избавиться от танатофобии — и надо ли?

Как танатофобия связана с остальными страхами? Что (не) поможет в борьбе с ней?

Psychologies
Среди антиквариата, талисманов и выкроек: где жили и творили дизайнеры высокой моды Среди антиквариата, талисманов и выкроек: где жили и творили дизайнеры высокой моды

Восемь самых интересных музеев моды по всему миру

Forbes
Содержание формы: как устроены отношения экипировщиков с клубами и сборными Содержание формы: как устроены отношения экипировщиков с клубами и сборными

Как устроен бизнес экипировщиков и кто больше всех зарабатывает на футболках?

Forbes
Дети в парламенте: как женщины-политики совмещают материнство с работой Дети в парламенте: как женщины-политики совмещают материнство с работой

Как женщины-политики добиваются права не выбирать между работой и материнством

Forbes
Открыть в приложении