Исследователи заподозрили существование собственного словаря у нейросети DALL-E 2

Григорий Копиев

Американские исследователи обнаружили у генеративной нейросети DALL-E 2, создающей изображения по текстовому описанию, необычные особенности. Текст на ее изображениях, который кажется случайным набором символов, вероятно, вовсе не является таковым и зачастую связан с конкретными объектами и понятиями. К примеру, по запросу «Apoploe vesrreaitais» модель обычно генерирует изображения с птицами. Исследователи предположили, что DALL-E 2 в процессе обучения формирует собственное подобие словаря. Статья, пока не прошедшая рецензирование, доступна на сайте авторов. Она вызвала активное обсуждение среди сообщества исследователей машинного обучения, которые опровергли некоторые тезисы авторов и подтвердили другие.

DALL-E 2 — это новая и улучшенная версия генеративной нейросети DALL-E, представленной OpenAI в начале 2021 года. Тогда исследователи рассказали одновременно о двух похожих моделях: DALL-E и CLIP. По сути они выполняют противоположные задачи: DALL-E генерирует реалистичное изображение по его текстовому описанию, данному человеком, а CLIP генерирует текстовое описание для данного ей изображения. В обоих случаях модели обучались на огромном объеме изображений и описаний и сумели выучить качественную связь между визуальным и текстовым представлением объектов и понятий. В представленной этой весной DALL-E 2 разработчики поменяли некоторые детали реализации и сумели повысить реалистичность генерируемых ей изображений. Тем не менее у нее все еще есть заметные проблемы, одна из которых — генерация надписей. Обычно модель генерирует либо набор латинских символов в неправильном порядке, либо использует несуществующие символы или узоры.

Исследователи заподозрили существование собственного словаря у нейросети DALL-E 2

Рекомендуемые статьи

Какие позы любят девушки? 9 самых-самых (бонус: позиции, которые их бесят)

Как выработанные привычки помогают не выгорать

Как развивалась карьера Юры Шатунова

Как появилась идея образовательного центра для талантливых детей из регионов

Почему собственная торговая марка — беда для небольших компаний

Аренда самоката — дело недешевое, гораздо выгоднее купить свой. Вопрос — какой?

Основательница ювелирного бренда — что меняется, когда твоя команда вырастает?

Первая глава «романа о воспитании» «Троя против всех» Александра Стесина

Писатель Александр Цыпкин о наших цифровых аватарах

Физики нагрели в «Глобуск-М2» дейтериевую плазму до очень высокой температуры

Рассказываем, почему компьютер не видит SSD и как решить эту проблему

Пышный, нежный, легкий — редкая мама могла повторить рецепт детсадовского омлета

Гайд по выбору подходящей именно вам модели ультрабука

Каким было правительство марионеточной «Финляндской Демократической Республики»

Представители малых народов совмещают традиции и современные технологии

Музыкант, умер 21 апреля 2016 года в городе Шанхассен, штат Миннесота

Погребальный комплекс относится ко II веку нашей эры

Отрывок из книги Кристи Тейт «Группа» о групповой терапии

Как северные народы отмечали самую короткую ночь в году?

Что не так с кетчупом?

Что такое подросток в постсоветском кино и что из него можно понять о взрослых

Ирина Чеснокова — о том, как русский бар встречают за границей

Совершенно необязательно проживать все в полную силу и взаправду

Ученые исследовали останки из двух погребений IV тысячелетия до нашей эры

Как построить каркас безопасности для спортивных классов N2?

История возбудителя трех известных чумных пандемий

Гипподам и «Гипподамова планировка»

Глава «Мерцающая сеть» из книги Оливии Лэнг — рассказ о художнице Агнес Мартин

Нерчинский Завод — обычная сибирская глубинка. Или нет?

Как сделать путешествие на поезде идиллическим?