SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Древний скелет позволил ученым разгадать тайну формирования населения Японии! Древний скелет позволил ученым разгадать тайну формирования населения Японии!

Современный геном Японии сформировался из протокорейцев и населения Дзёмон

ТехИнсайдер
Айсен Николаев о векторе развития республики Саха: «Экономический рост должен улучшать жизнь людей» Айсен Николаев о векторе развития республики Саха: «Экономический рост должен улучшать жизнь людей»

Якутия поражает темпами социального и экономического развития

ФедералПресс
Что сильнее губит экологию: электрокары или двигатели внутреннего сгорания Что сильнее губит экологию: электрокары или двигатели внутреннего сгорания

С ростом популярности электромобилей появляются сомнения насчет их экологичности

Maxim
Синхронное плавание Синхронное плавание

Владимир Кристовский и его жена Ольга о вдохновении для всех, кто его ищет

Psychologies
«Я-ловушка» и еще 4 тренда дейтинг-приложений, которые ждут нас в 2025 году «Я-ловушка» и еще 4 тренда дейтинг-приложений, которые ждут нас в 2025 году

Пять тенденций в сфере знакомств, которые будут актуальны в 2025 году

Psychologies
Топ-5 лучших фанатских версий сериальных концовок аниме Топ-5 лучших фанатских версий сериальных концовок аниме

Поклонники аниме считают, что они смогли бы лучше закончить некоторые истории

Maxim
Фартук, косы, кружева Фартук, косы, кружева

Какой была школьная форма в СССР

Лиза
Инновационные решения ЦНИРТИ армии и флоту к 120-летию РЭБ Инновационные решения ЦНИРТИ армии и флоту к 120-летию РЭБ

Основные направления деятельности ЦНИРТИ сегодня

Обозрение армии и флота
«Это ЗИЛ?!» Как советские инженеры изобретали совершенный вездеход «Это ЗИЛ?!» Как советские инженеры изобретали совершенный вездеход

Машины, по проходимости которым не было бы равных

ТехИнсайдер
Как убрать запах из стиральной машины Как убрать запах из стиральной машины

Запах из стиральной машины: почему так происходит и как быстро решить вопрос

CHIP
«Что можно было локализовать быстро, мы уже локализовали» «Что можно было локализовать быстро, мы уже локализовали»

О рынке продуктов и решений в области энергетики и автоматизации

РБК
От помощника в обучении до будущей профессии От помощника в обучении до будущей профессии

Как меняются школы и вузы под влиянием искусственного интеллекта

РБК
«Мой парень — маньяк» — жуткий триллер о правилах жизни в большом городе «Мой парень — маньяк» — жуткий триллер о правилах жизни в большом городе

Триллер «Мой парень — маньяк» напоминает: ты одинок, значит в опасности

VOICE
Записки отельера: жизнь взаймы Записки отельера: жизнь взаймы

Короткое, но важное соприкосновение отельера с искусственным интеллектом

Правила жизни
Вкус ностальгии: блюда, которые были в каждой советской школьной столовой Вкус ностальгии: блюда, которые были в каждой советской школьной столовой

Вспоминаем, какие блюда подавали в каждой школе СССР

ТехИнсайдер
Секс — мощное оружие маркетинга: жесткая диктатура длинных ног и коротких половых связей Секс — мощное оружие маркетинга: жесткая диктатура длинных ног и коротких половых связей

Почему быть сексуальным и иметь половую жизнь — это показатель престижа?

Psychologies
Шефы XXI века Шефы XXI века

На кухнях ресторанов все чаще можно встретить молодых шеф-поваров

Bones
Бесчеловечный флот Америки Бесчеловечный флот Америки

Основные программы в области создания надводных роботизированных систем ВМС США

Обозрение армии и флота
«Я шопоголик»: как перестать тратить деньги впустую «Я шопоголик»: как перестать тратить деньги впустую

Как диагностировать у себя шопоголизм и победить его?

Psychologies
«Насилие, алкоголь и порно не делают вас мужчиной»: что на самом деле значит «быть мужественным» «Насилие, алкоголь и порно не делают вас мужчиной»: что на самом деле значит «быть мужественным»

Что заставляет мужчин развиваться и добиваться успеха?

Psychologies
Дети и новый муж Дети и новый муж

Cоветы по сближению детей с новым партнером и основные промахи

Лиза
Снижение самооценки и панические атаки: чем опасно позитивное мышление Снижение самооценки и панические атаки: чем опасно позитивное мышление

Стоит ли придерживаться позитивного мышления? Отвечает гештальт-терапевт

Psychologies
Диво дивное Диво дивное

Воронежская область — поля подсолнухов, меловые столбы и водная гладь Дона

Лиза
Фьюзинг: дедовский метод Фьюзинг: дедовский метод

Процесс создания красоты, «фьюзинг», — давняя и довольно традиционная технология

КАНТРИ Русская азбука
Редкое животное и первые кадры! Фермер из Боливии сумел заснять амазонскую ласку: видео Редкое животное и первые кадры! Фермер из Боливии сумел заснять амазонскую ласку: видео

Об удивительном существе из густых лесов Амазонки известно не так много

ТехИнсайдер
Яйца: со Cветлой Пaсхoй! Яйца: со Cветлой Пaсхoй!

Обычай раскрашивать и дарить яйца на Пасху еще более древний, чем сам праздник

КАНТРИ Русская азбука
Скажи мне, кто твой друг Скажи мне, кто твой друг

Национальные парки, экофермы, питомники с редкими животными: топ-12 таких мест

2Xplore
Я себя сделала сама: как женщины доказали, что они тоже могут быть self-made Я себя сделала сама: как женщины доказали, что они тоже могут быть self-made

Как понятие self-made помогает женщинам заявлять о себе

Forbes
10 лучших новых сериалов, которые должен посмотреть каждый. Выбор читателей «Правил жизни» 10 лучших новых сериалов, которые должен посмотреть каждый. Выбор читателей «Правил жизни»

Подборка сериалов, в которой каждый найдет что-то для себя

Правила жизни
Телескоп TESS отыскал две суперземли у края обитаемой зоны маломассивных красных карликов Телескоп TESS отыскал две суперземли у края обитаемой зоны маломассивных красных карликов

Космический телескоп TESS обнаружил две суперземли у красных карликов

N+1
Открыть в приложении