Сегодня активно обсуждается «коллапс модели». Насколько это опасно?

ТехИнсайдерHi-Tech

Что такое «коллапс модели», чем он угрожает развитию ИИ и человека

Сегодня активно обсуждается так называемый «коллапс модели», явление при котором нейросеть деградирует и перестает работать. Но насколько реалистичны эти прогнозы и что вообще такое этот «коллапс модели»? С этим попробовал разобраться Аарон Дж. Сносвелл научный сотрудник по вопросам ИИ, Квинслендского технологического университета.

Владимир Губайловский

5925e3452d7f503fd3b5c03aa9bd4895_ce_900x600x293x0.jpg
Когда модели изображений искусственного интеллекта обучаются на собственных результатах, они могут создавать искаженные изображения, изуродованные пальцы или странные узоры. Изображения, созданные Sina Alemohammad and others.

Обсуждавшийся еще 2023 году, но ставший популярным совсем недавно «коллапс модели» относится к гипотетическому сценарию, при котором будущие системы ИИ деградируют, потому что обучаются на данных генерируемых ИИ.

Современные системы ИИ строятся на основе машинного обучения. Программисты закладывают математическую структуру, но реальный «интеллект» появляется в результате обучения системы на определенных дата-сетах.

Это не любые данные. Современным генеративным системам ИИ нужны высококачественные данные, причем в большом количестве. 

Сколько надо данных

«Чтобы обучить GPT-3, OpenAI понадобилось более 650 миллиардов английских слов текста — примерно в 200 раз больше, чем вся английская Википедия. Но для этого требовалось собрать почти в 100 раз больше исходных данных из интернета и 98% которых было затем отфильтровано и отброшено», — пишет Аарон Дж. Сносвелл со ссылкой на статью, размещенную на сервере arxiv.

Чтобы получить эти данные, крупные технологические компании, такие как OpenAI, Google, Meta (признана экстремистской организацией на территории РФ) и Nvidia, постоянно сканируют интернет, собирая терабайты контента, чтобы «накормить» машины. Но после появления в 2022 году широкодоступных и полезных систем генеративного ИИ люди все чаще загружают и делятся контентом, частично или полностью созданным ИИ.

В 2023 году исследователи начали задумываться о том, нельзя ли обойтись для обучения только данными, созданными ИИ, вместо данных, сгенерированных человеком.

Для этого есть огромные стимулы. Контент, созданный ИИ гораздо дешевле, чем данные, созданные человеком. Кроме того, его собирание не вызывает сомнений с этической и юридической точек зрения. На него ни у кого нет авторских прав, кроме компании которая его создает. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Опасно ли прятаться в машине от грозы: это объяснение поймет даже школьник Опасно ли прятаться в машине от грозы: это объяснение поймет даже школьник

Если гроза застала вас в пути, чем станет машина – спасением или смертью?

ТехИнсайдер
Как простить родителей за детские травмы? Как простить родителей за детские травмы?

Как простить родителей за детские травмы и как это облегчит нашу жизнь?

Psychologies
Образование без серверов: как и зачем использовать облачные технологии вузам Образование без серверов: как и зачем использовать облачные технологии вузам

Использование облачных технологий в процессе образования улучшает успеваемость

Forbes
Один раз, еще не жена Один раз, еще не жена

Однажды я провел за два года три свадьбы у одной и той же невесты!

Men Today
Александр Великий Александр Великий

Македонец, покоривший мир

kiozk originals
Змею вырвало двумя змеями поменьше Змею вырвало двумя змеями поменьше

Герпетолог встретил индиговую змею, которую вырвало двумя более мелкими змеями

N+1
50 фактов об аистах: зачем они испражняются на свои ноги и почему эти птицы — суровые родители? 50 фактов об аистах: зачем они испражняются на свои ноги и почему эти птицы — суровые родители?

Борьба самок за самцов, сон стоя, доверчивость и другие факты об аистах

ТехИнсайдер
Ах, эта язва! Ах, эта язва!

Какого специального лечения зачастую требует стоматит?

Лиза
Независимая генетика Независимая генетика

Как решить проблему технологического отставания в российском АПК

Агроинвестор
На новой высоте На новой высоте

Квартира непростой архитектуры, с огромной антресолью и множеством несущих балок

Идеи Вашего Дома
Пробуксовка на грузовом маршруте Пробуксовка на грузовом маршруте

Продажи грузовиков в России падают. Почему?

Монокль
Бюджетные игровые ноутбуки: топ-6 лучших Бюджетные игровые ноутбуки: топ-6 лучших

Игровые ноутбуки, которые не разорят ваш бюджет

CHIP
«Кометы. Странники Солнечной системы» «Кометы. Странники Солнечной системы»

Как определить параметры ядра кометы

N+1
Как правильно ухаживать за разделочными досками Как правильно ухаживать за разделочными досками

Поддержание досок в идеальном состоянии  — это не просто прихоть «красоты»

ТехИнсайдер
Чем заменить Notion: 7 российских альтернатив Чем заменить Notion: 7 российских альтернатив

Приложения, которые помогут собрать все файлы в одном месте и ничего не потерять

VC.RU
Аналог полиции и прототип ФБР: история Национального детективного агентства Пинкертона Аналог полиции и прототип ФБР: история Национального детективного агентства Пинкертона

Пинкертоны: одно из первых детективных агентств

ТехИнсайдер
Мухи с котлетами: почему третий бак не решит проблему переработки пищевых отходов Мухи с котлетами: почему третий бак не решит проблему переработки пищевых отходов

Почему отдельный бак для пищевых отходов не избавит страну от выброшенной еды?

Forbes
Как мир становился многополярным Как мир становился многополярным

Почему концепция многополярности не обрела прочных теоретических оснований?

Монокль
Кто остановит испанского слизня Кто остановит испанского слизня

Какие методы борьбы существуют против инвазивного вредителя — испанского слизня

Наука
Сезон не охоты Сезон не охоты

Как вдохновиться на подвиг вернуться к тренировкам?

Men Today
«Внеждановщина: Советская послевоенная политика в области культуры как диалог с воображаемым Западом» «Внеждановщина: Советская послевоенная политика в области культуры как диалог с воображаемым Западом»

Что не понравилось Сталину в фильме «Большая жизнь»

N+1
Ближний Дальний Восток Ближний Дальний Восток

Какие уроки истории стоит не забывать современным экономистам

Деньги
Ржавое золото Ржавое золото

Автомобильные реликвии, которые обнаруживают слишком поздно

Men Today
Ученые доказали эффективность наночастиц золота при лечении рака Ученые доказали эффективность наночастиц золота при лечении рака

Как ученые доказали результативность наночастиц золота для борьбы с раком

ТехИнсайдер
Шутки в сторону. Почему «Джокер: Безумие на двоих» одновременно и разочарование, и удача? Шутки в сторону. Почему «Джокер: Безумие на двоих» одновременно и разочарование, и удача?

«Джокер: Безумие на двоих»: фильм, который одновременно восхищает и раздражает

Правила жизни
Ушел из жизни бывший тренер Марии Шараповой и Анастасии Мыскиной Ушел из жизни бывший тренер Марии Шараповой и Анастасии Мыскиной

Скончался наставник нескольких звезд тенниса. Роберт Лэнсдорп прожил 85 лет

VOICE
Это их угробит: 5 вещей, которые ни в коем случае нельзя мыть меламиновой губкой Это их угробит: 5 вещей, которые ни в коем случае нельзя мыть меламиновой губкой

Не каждая хозяйка знает, что меламиновые губки подходят не для всякой работы

ТехИнсайдер
Григорий Сергеев: Ищу человека Григорий Сергеев: Ищу человека

История-поиск о тех, кто потерялся и нашел (в том числе себя)

Maxim
С электроникой в башке С электроникой в башке

Как в России развиваются исследования интерфейса мозг—компьютер

Наука
Неврологи описали изменения мозга у беременной женщины Неврологи описали изменения мозга у беременной женщины

Ученые провели 26 томографий беременной, чтобы оценить изменения ее мозга

N+1
Открыть в приложении