SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Докторская» колбаса и зеленка: вещи, придуманные в СССР, которыми мы пользуемся до сих пор «Докторская» колбаса и зеленка: вещи, придуманные в СССР, которыми мы пользуемся до сих пор

Наработки из СССР, над которыми время оказалось не властно

ТехИнсайдер
Трогательная история! Как стоматолога из Сирии воспитал отец с синдромом Дауна Трогательная история! Как стоматолога из Сирии воспитал отец с синдромом Дауна

Люди с синдромом Дауна не могут стать хорошими отцами? Джад Исса с этим поспорит

ТехИнсайдер
Испорченный телефон: как защитить свое устройство от прослушки Испорченный телефон: как защитить свое устройство от прослушки

Как определить, есть ли лишние «уши» у вашего телефона и что делать, если да

ТехИнсайдер
Заполнить униформу Заполнить униформу

Как армейские куртки стали инструментом борьбы с системой

Правила жизни
Как повысить уровень жизни: техника маленьких шагов Как повысить уровень жизни: техника маленьких шагов

Что такое «денежный потолок» и как его расширить, улучшив качество жизни

Psychologies
Чай по всем канонам Чай по всем канонам

Как приготовить правильный чай и что при этом важно не упустить из виду

КАНТРИ Русская азбука
Эти рыбы должны создать красивые круги из песка, чтобы привлечь самок! Интересные факты Эти рыбы должны создать красивые круги из песка, чтобы привлечь самок! Интересные факты

Самцы японской рыбы-фугу принимают необычный вызов в брачный период

ТехИнсайдер
Мнение эксперта: Фрейда «неправильно поняли»! Он не был одержим сексом, как принято считать Мнение эксперта: Фрейда «неправильно поняли»! Он не был одержим сексом, как принято считать

Зигмунд Фрейд не считал, что все фантазии во сне — это подавленная эротика

ТехИнсайдер
Моя попытка номер… Моя попытка номер…

Актеры, которые поступили в театральный вуз не с первого раза

Лиза
Ангелы прилетели Ангелы прилетели

Мастер-класс по самодельным ангелам, дарящим ощущение праздника и чудес

КАНТРИ Русская азбука
Смышленый и не малый. Тест-драйв нового Haval F7 Смышленый и не малый. Тест-драйв нового Haval F7

Чем удивил на тест-драйве новый Haval F7 и сколько он стоит

РБК
В Кении нашли древнейшего австралопитека В Кении нашли древнейшего австралопитека

Как был обнаружен древнейший представитель рода австралопитеков

N+1
История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое

Кто и как изобрел первый компактный аналоговый информационный носитель

Правила жизни
Два «кукурузника»: у нашего родного биплана По-2 нашелся американский брат-близнец Два «кукурузника»: у нашего родного биплана По-2 нашелся американский брат-близнец

Зачем Boeing разрабатывала «кукурузники»?

ТехИнсайдер
Термоэрозия мерзлоты помешает Северному ледовитому океану поглощать углекислый газ Термоэрозия мерзлоты помешает Северному ледовитому океану поглощать углекислый газ

Как таяние многолетней мерзлоты мешает поглощению углекислого газа

N+1
Перегрелись: зачем останавливать глобальное потепление, если оно уже наступило Перегрелись: зачем останавливать глобальное потепление, если оно уже наступило

О том, как бороться с изменением климата, когда оно уже наступило

Forbes
Старик и Ворон Старик и Ворон

Билл Скарсгорд в новой адаптации культового комикса

Weekend
Ярославский разлив Ярославский разлив

Бренд-директор ЯЛВЗ Роман Визе — о том, как все коктейли делать на основе водки

Bones
6 книг о сексе в современном мире 6 книг о сексе в современном мире

Книги, которые помогут взглянуть на сексуальность с разных точек зрения

Psychologies
Уйти в айти Уйти в айти

7 востребованных IT-профессий, которые можно освоить, даже если ты гуманитарий

Лиза
Поднять паруса: проложат ли нанотехнологии путь к звездам Поднять паруса: проложат ли нанотехнологии путь к звездам

Скоро ли начнутся регаты в межзвездном пространстве?

Forbes
Эксперт рассказал, как меньше пьянеть! Факты о толерантности к алкоголю Эксперт рассказал, как меньше пьянеть! Факты о толерантности к алкоголю

Почему одни люди могут выпить больше других?

ТехИнсайдер
Микробы, завернутые в лаваш: какую опасность таит шаурма Микробы, завернутые в лаваш: какую опасность таит шаурма

Что скрывается в шаурме и как выбрать безопасный для здоровья продукт?

ТехИнсайдер
Мир до Александра. Путешествие начинается… Мир до Александра. Путешествие начинается…

География древнего мира: что греки знали о землях, странах и народах?

Знание – сила
«Стихи Живаго и есть то, что нужно было сказать» «Стихи Живаго и есть то, что нужно было сказать»

Константин Поливанов о том, зачем Пастернаку понадобился доктор Живаго

Weekend
Сколько зарабатывает дальнобойщик и как им стать Сколько зарабатывает дальнобойщик и как им стать

Как стать дальнобойщиком и сколько он зарабатывает, выяснил Autonews.ru

РБК
Вернуть в семью: как развод Бакальчук показал отношение общества к выбору женщины Вернуть в семью: как развод Бакальчук показал отношение общества к выбору женщины

Почему взрослую женщину просят вернуть мужу, как расценивать такие призывы?

Forbes
5 захватывающих книг, которые можно успеть прочитать до конца лета 5 захватывающих книг, которые можно успеть прочитать до конца лета

Пять книг, каждая из которых открывает читателю новые грани окружающего мира

Maxim
Кто ты, мой новый герой? Кто ты, мой новый герой?

Слава Копейкин и Денис Косиков зажигают звезды

Men Today
Инновационные решения ЦНИРТИ армии и флоту к 120-летию РЭБ Инновационные решения ЦНИРТИ армии и флоту к 120-летию РЭБ

Основные направления деятельности ЦНИРТИ сегодня

Обозрение армии и флота
Открыть в приложении