Новый способ оптимизации предварительного обучения Больших языковых моделей

ТехИнсайдерHi-Tech

Разработан более дешевый способ обучения Больших языковых моделей

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы. Это позволит значительно удешевить разработку Больших языковых моделей и сделать их создание более доступным независимым разработчикам.

Владимир Губайловский

ce9cebf76db8bc7877647f1250420a14_ce_1974x1316x0x83.jpg
Unsplash.com. DeepMind

Цель таких работ — сделать Большие языковые модели (такие как GPT), требующие миллионы на обучение, работающие на мощнейших компьютерах с огромными дата-центрами, доступными на домашнем компьютере или смартфоне. И разработчики двигаются в этом направлении.

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы.

ChatGPT и другие приложения, использующие Большие языковые модели (LLM), находят все более широкое применение и привлекают пристальное внимание СМИ. Однако в сфере LLM доминируют несколько крупных технологических компаний, поскольку предварительное обучение этих моделей является чрезвычайно дорогостоящим процессом: стоимость начинается с 10 миллионов долларов. Сколько стоило обучение GPT не сообщается, но оценить его в миллиард долларов не будет серьезным преувеличением.

«Большие языковые модели не очень-то доступны для небольших организаций или академических групп», — говорит Хонг Лю, аспирант факультета информатики Стэнфордского университета.

Чтобы изменить ситуацию, Лю и его коллеги решили усовершенствовать существующие методы оптимизации LLM. В результате был разработан подход под названием Sophia, который сокращает время предварительного обучения вдвое. 

Оптимизация оптимизации

507231df3ff536c824bc47835115b915.jpg
Unsplash.com. DeepMind

Чтобы оптимизировать предварительное обучение LLM ученые использовали два приема. Первый, известный как оценка кривизны, не нов, но команда Стэнфорда нашла способ сделать его более эффективным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Посмотрите на реконструкцию лица мумии! Она таинственным образом появилась в школе в 1915 году Посмотрите на реконструкцию лица мумии! Она таинственным образом появилась в школе в 1915 году

«В процессе реконструкции есть момент, когда внезапно появляется лицо»

ТехИнсайдер
Политика и бокс: семь фильмов о женской карьере в «мужских» профессиях Политика и бокс: семь фильмов о женской карьере в «мужских» профессиях

Фильмы о женщинах в политике, силовых видах спорта, армии, на шахте и в такси

Forbes
Зеленые технологии спасут мир: как GreenTech помогает избавить планету от мусора Зеленые технологии спасут мир: как GreenTech помогает избавить планету от мусора

GreenTech – не новомодное слово, а отрасль, которая сегодня спасает природу

ТехИнсайдер
7 аудиокниг для совместного прослушивания с детьми 7 аудиокниг для совместного прослушивания с детьми

Озвученные уютные произведения для семейных вечеров

СНОБ
«Как умирали динозавры: Убийственный астероид и рождение нового мира» «Как умирали динозавры: Убийственный астероид и рождение нового мира»

Почему на Земле не началась вторая эра динозавров

N+1
Не сексом единым: как понять, что у мужчины дефицит тестостерона — 8 симптомов Не сексом единым: как понять, что у мужчины дефицит тестостерона — 8 симптомов

Как повысить уровень мужского «сексуального» гормона?

Psychologies
Телефонная зависимость: что такое фаббинг и как с ним справиться Телефонная зависимость: что такое фаббинг и как с ним справиться

Как распознать у себя фаббинг и как от него избавиться

Правила жизни
Дрон проехался по земле внутри вращающейся сферической клетки Дрон проехался по земле внутри вращающейся сферической клетки

Гибридный робот, который способен как летать, так и ездить по поверхности

N+1
Снимите это немедленно! 5 историй людей, у которых изменилась жизнь после разбора гардероба со стилистом Снимите это немедленно! 5 историй людей, у которых изменилась жизнь после разбора гардероба со стилистом

Разбор гардероба со стилистом – ну разве не мечта?

Лиза
Действительно сильные женщины: как японки борются за право заниматься сумо Действительно сильные женщины: как японки борются за право заниматься сумо

Японки практиковали сумо в древности, и сегодня отстаивают свое право на него

Forbes
От итальянских рабочих до суперзвезд и инфлюенсеров: история белой майки От итальянских рабочих до суперзвезд и инфлюенсеров: история белой майки

Откуда вообще взялась белая майка и при чем тут алкоголики и расизм

Правила жизни
Тельца Краузе в клиторе и пенисе мышей отреагировали на вибрацию Тельца Краузе в клиторе и пенисе мышей отреагировали на вибрацию

Мыши без телец Краузе с трудом начинали половой акт

N+1
Орнитологи предсказали гнездовой материал птиц по форме клюва Орнитологи предсказали гнездовой материал птиц по форме клюва

Как форма клюва у птиц влияет на строительство их гнезд

N+1
Жизнь дала им второй шанс: реальные истории людей, которые чудом выжили в невероятных обстоятельствах Жизнь дала им второй шанс: реальные истории людей, которые чудом выжили в невероятных обстоятельствах

Случаи этих людей — настоящее чудо

ТехИнсайдер
Когда закончится музыка. Как жил и писал хиты Джим Моррисон Когда закончится музыка. Как жил и писал хиты Джим Моррисон

Как The Doors изменили мировую музыку

СНОБ
Снесший в XII веке одну из гималайских вершин мегаобвал пролил свет на эволюцию высокогорных систем Снесший в XII веке одну из гималайских вершин мегаобвал пролил свет на эволюцию высокогорных систем

Как может протекать долгосрочная топографическая эволюция высокогорных регионов

N+1
Персона Персона

Андрей Кошкин о том, как хранить традиции, оставаясь в авангарде

Robb Report
Нулевая уязвимость: сколько российский бизнес тратит на защиту от киберугроз Нулевая уязвимость: сколько российский бизнес тратит на защиту от киберугроз

Сколько тратят компании, чтобы снизить риски кибератак для бизнеса

Forbes
«Идеи живут вечно». Что общего у «Барби» и «Оппенгеймера» «Идеи живут вечно». Что общего у «Барби» и «Оппенгеймера»

Почему все сравнивают «Барби» и «Оппенгеймера»?

СНОБ
6 самых токсичных привычек: проверьте себя и близких 6 самых токсичных привычек: проверьте себя и близких

Привычки, которые мешают налаживать гармоничные отношения с другими людьми

Psychologies
Необъяснимые загадки молний: почему нельзя звонить в грозу и как электричество срывает с людей одежду Необъяснимые загадки молний: почему нельзя звонить в грозу и как электричество срывает с людей одежду

Молния — физическое явление, способное вытворять очень странные штуки

Maxim
Палеогенетики выявили семь поколений родственников эпохи неолита Палеогенетики выявили семь поколений родственников эпохи неолита

Палеогенетики отсеквенировали ДНК 99 человек, живших в эпоху неолита

N+1
Идеальный партнер: миф или реальность — размышления психоаналитиков Идеальный партнер: миф или реальность — размышления психоаналитиков

Отправляясь на поиски идеала, кого мы хотим встретить? И нужен ли этот идеал?

Psychologies
Биография в дырочку Биография в дырочку

«Отец шатунов»: книга о Мамлееве, равная своему герою

Weekend
Сливки европейского edtech: как меняется европейский рынок образовательных технологий Сливки европейского edtech: как меняется европейский рынок образовательных технологий

Как меняется фокус образовательных технологий

Inc.
До встречи в книжном: 7 отличных романов для отпуска До встречи в книжном: 7 отличных романов для отпуска

Добрые, милые, уютные истории, которые заставят переживать, но кончатся хорошо

Psychologies
Слитые нюдсы и непрошенные дикпики: что нужно знать подростку о секстинге в интернете Слитые нюдсы и непрошенные дикпики: что нужно знать подростку о секстинге в интернете

Как принимать решения, связанные с сексом — в том числе обозначать свои границы?

Psychologies
Одна инъекция антивозрастного протеина улучшает память обезьян Одна инъекция антивозрастного протеина улучшает память обезьян

Инъекция обезьянам белка "фактора долголетия" улучшает их когнитивные функции

ТехИнсайдер
Какой хищник опаснее всех на Земле? Какой хищник опаснее всех на Земле?

Это самый прожорливый хищник, которого когда-либо знала наша планета

ТехИнсайдер
Древние люди из Леванта добыли несколько тонн кремня для рубил примерно в 20 километрах от стоянки Древние люди из Леванта добыли несколько тонн кремня для рубил примерно в 20 километрах от стоянки

Исследователи выяснили, где брали сырье обитатели двух ашельских стоянок

N+1
Открыть в приложении