Сегодня активно обсуждается «коллапс модели». Насколько это опасно?

ТехИнсайдерHi-Tech

Что такое «коллапс модели», чем он угрожает развитию ИИ и человека

Сегодня активно обсуждается так называемый «коллапс модели», явление при котором нейросеть деградирует и перестает работать. Но насколько реалистичны эти прогнозы и что вообще такое этот «коллапс модели»? С этим попробовал разобраться Аарон Дж. Сносвелл научный сотрудник по вопросам ИИ, Квинслендского технологического университета.

Владимир Губайловский

5925e3452d7f503fd3b5c03aa9bd4895_ce_900x600x293x0.jpg
Когда модели изображений искусственного интеллекта обучаются на собственных результатах, они могут создавать искаженные изображения, изуродованные пальцы или странные узоры. Изображения, созданные Sina Alemohammad and others.

Обсуждавшийся еще 2023 году, но ставший популярным совсем недавно «коллапс модели» относится к гипотетическому сценарию, при котором будущие системы ИИ деградируют, потому что обучаются на данных генерируемых ИИ.

Современные системы ИИ строятся на основе машинного обучения. Программисты закладывают математическую структуру, но реальный «интеллект» появляется в результате обучения системы на определенных дата-сетах.

Это не любые данные. Современным генеративным системам ИИ нужны высококачественные данные, причем в большом количестве. 

Сколько надо данных

«Чтобы обучить GPT-3, OpenAI понадобилось более 650 миллиардов английских слов текста — примерно в 200 раз больше, чем вся английская Википедия. Но для этого требовалось собрать почти в 100 раз больше исходных данных из интернета и 98% которых было затем отфильтровано и отброшено», — пишет Аарон Дж. Сносвелл со ссылкой на статью, размещенную на сервере arxiv.

Чтобы получить эти данные, крупные технологические компании, такие как OpenAI, Google, Meta (признана экстремистской организацией на территории РФ) и Nvidia, постоянно сканируют интернет, собирая терабайты контента, чтобы «накормить» машины. Но после появления в 2022 году широкодоступных и полезных систем генеративного ИИ люди все чаще загружают и делятся контентом, частично или полностью созданным ИИ.

В 2023 году исследователи начали задумываться о том, нельзя ли обойтись для обучения только данными, созданными ИИ, вместо данных, сгенерированных человеком.

Для этого есть огромные стимулы. Контент, созданный ИИ гораздо дешевле, чем данные, созданные человеком. Кроме того, его собирание не вызывает сомнений с этической и юридической точек зрения. На него ни у кого нет авторских прав, кроме компании которая его создает. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как Мехран Насери из Ирана жил в аэропорту Парижа в течение 18 лет: история из фильма Как Мехран Насери из Ирана жил в аэропорту Парижа в течение 18 лет: история из фильма

История Мехрана Насери — иранца, который так и не смог покинуть зону ожидания

ТехИнсайдер
Лас-Вегас — Петушки Лас-Вегас — Петушки

Как снять фильм, в котором «пить» рифмуется с «играть»

Weekend
От мела к модели: как искусственный интеллект перестраивает образовательный процесс От мела к модели: как искусственный интеллект перестраивает образовательный процесс

ИИ вошел во многие сферы жизни. Не избежала его и система образования

ТехИнсайдер
«Культурные пожары» индейцев помогут спасти медведей и журавлей. Оказывается, в них есть смысл «Культурные пожары» индейцев помогут спасти медведей и журавлей. Оказывается, в них есть смысл

Экологи заново учатся древнему искусству выжигания земель

ТехИнсайдер
Как и зачем одна женщина записала и сохранила более 30 лет передач на ТВ в США Как и зачем одна женщина записала и сохранила более 30 лет передач на ТВ в США

Архив Мэрион Стокс — это уникальная хроника истории

ТехИнсайдер
ChatGPT превзошел врачей в оценке респираторных заболеваний у детей ChatGPT превзошел врачей в оценке респираторных заболеваний у детей

В оценке респираторных заболеваний ChatGPT показал лучшие результаты, чем врачи

ТехИнсайдер
Чем заняться в Калининграде, чтобы расслабиться? 6 беспроигрышных идей Чем заняться в Калининграде, чтобы расслабиться? 6 беспроигрышных идей

Калининград поможет легко отключиться от рутины

Psychologies
«Я пишу здесь только правду». Отрывок из дневников Ольги Берггольц «Я пишу здесь только правду». Отрывок из дневников Ольги Берггольц

Отрывок из дневниковых записях о последних днях жизни мужа Ольги Берггольц

СНОБ
Бан и вылет. За какие проступки сурово наказывали футбольные клубы Бан и вылет. За какие проступки сурово наказывали футбольные клубы

Примеры, когда футбольный клуб вопреки игре вылетал или получал дисквалификацию

СНОБ
Органический синтез в молекулярных облаках Органический синтез в молекулярных облаках

В космосе обнаружена очередная сложная органическая молекула

Знание – сила
Веселье без шумства Веселье без шумства

Как европейское искусство перестало бояться и полюбило вакханалии

Weekend
Плоды просвещения Плоды просвещения

При всей работоспособности Дмитрий Волков был истинным сыном века

Дилетант
Как заселяли Америку Как заселяли Америку

Когда именно и как шло расселение человека на американском континенте?

Наука и техника
Погода в доме: как знаки зодиака влияют на атмосферу в семье Погода в доме: как знаки зодиака влияют на атмосферу в семье

Как знак зодиака может повлиять на отношения внутри семьи?

VOICE
Два алтаря для одной жертвы Два алтаря для одной жертвы

Как героиня греческого мифа Ифигения из символа подвига стала символом отчаяния

Weekend
Артиллерия в новом веке Артиллерия в новом веке

Основные направления развития рынка артиллерийского вооружения

Обозрение армии и флота
«Надо уважать чужое мнение за то, что оно чужое» «Надо уважать чужое мнение за то, что оно чужое»

Как Юрий Лотман пересилил время

Weekend
Таинственный организм, обнаруженный в озере Моно, может переписать историю жизни Таинственный организм, обнаруженный в озере Моно, может переписать историю жизни

Ученые обнаружили в озере Моно новый вид одноклеточных организмов

ТехИнсайдер
Интуиция или тревога: каким бывает предчувствие и как с ним справиться Интуиция или тревога: каким бывает предчувствие и как с ним справиться

Как освободиться от излишней тревожности, чтобы жить в спокойствии?

Psychologies
Почему страшно быть счастливым? Почему страшно быть счастливым?

Почему многие неосознанно избегают своего счастья?

Здоровье
Вперед, к гармонии Вперед, к гармонии

В чем отличие Seadeck 6 от лодок предыдущего поколения?

Y Magazine
Делиться, не владеть: как меняется рынок шеринга в России и в мире Делиться, не владеть: как меняется рынок шеринга в России и в мире

Почему рынок шеринга переживает бурный рост во всем мире?

ТехИнсайдер
Откуда что пошло на флоте. Навигационные огни Откуда что пошло на флоте. Навигационные огни

Как на свет появились навигационные огни для опознания судов?

Наука и техника
Другой фокус Другой фокус

Ольга Сутулова о детских комплексах и новой философии красоты

Новый очаг
Григорий Сергеев: Ищу человека Григорий Сергеев: Ищу человека

История-поиск о тех, кто потерялся и нашел (в том числе себя)

Maxim
Дальше — больше Дальше — больше

Российские художники, чьи инсталляции меняют взгляд человека на окружающий мир

СНОБ
Жили-были Жили-были

История наших героев похожа на сказку, но завязка в ней совсем иная

Seasons of life
Где посмотреть современный арт в Казанском кремле Где посмотреть современный арт в Казанском кремле

Как в Казани старинные постройки получают новую жизнь и новые смыслы

Psychologies
Институт травмы: каждый третий элитный спортсмен пережил опыт насилия в детстве Институт травмы: каждый третий элитный спортсмен пережил опыт насилия в детстве

С насилием в той или иной сфере столкнулись 75% спортсменов

Forbes
Домашняя роскошь Домашняя роскошь

Тонкий баланс между уютом и роскошью — золото, натуральные материалы

SALON-Interior
Открыть в приложении