Ученые создали инструмент для редактирования объектов на изображении

N+1Hi-Tech

Нейросеть получила удобный интерфейс редактирования изображений

Он напоминает редактор внешности в видеоиграх

Виктория Земляк

40c394a560f62d417ec8c9208cc0404f.gif
Пример работы DragGAN. Theobalt et al. / arXiv, 2023

Ученые из США и Германии создали инструмент для редактирования объектов на изображении DragGAN. Он основан на нейросети, которая на лету генерирует новые изображения. Пользователь может отмечать мышкой разные элементы на фотографии, и они реалистично перемещаются, поворачиваются, растягиваются и уменьшаются — похожий подход нередко используют в видеоиграх для редактирования внешности персонажа. Препринт доступен на arXiv.org.

В последние пару лет случился бум диффузионных нейросетей для генерации изображений по текстовым запросам — например, Stable Diffusion, DALL-E и Midjourney. Диффузионная модель умеет генерировать реалистичные изображения из случайного шума, а текстовое описание подсказывает модели, что именно должно быть на изображении. Но есть проблема: диффузионные нейросети недостаточно точны и не подходят, если нужно выполнить очень конкретную задачу при редактировании: сдвинуть объект на несколько пикселей в определенную сторону или повернуть его на определенное количество градусов.

Задачу точного редактирования изображений можно решить с помощью других нейросетевых архитектур. Например, до появления диффузионных нейросетей часто использовали GAN — генеративно-состязательные сети. Такая модель состоит из двух нейросетей: генеративной и состязательной. По сути две нейросети соревнуются друг с другом: состязательная сеть учится отличать реальные изображения от сгенерированных, а генеративная, в свою очередь, пытается сгенерировать максимально реалистичные изображения из случайного шума (на этой идее основаны и диффузионные модели). Состязательная сеть посылает сигнал генеративной модели — сообщает ей, насколько реалистичное получилось изображение. И так до тех пор, пока генеративная сеть не научится обманывать состязательную.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

В Португалии нашли выгравированные в эпоху верхнего палеолита фигуры животных В Португалии нашли выгравированные в эпоху верхнего палеолита фигуры животных

Археологи обнаружили в Португалии новые произведения палеолитического искусства

N+1
Зоопарки России Зоопарки России

К Дню защиты детей сделали подборку лучших зоологических садов

Лиза
IT-разработка «внутри» или готовое решение: что выбрать IT-разработка «внутри» или готовое решение: что выбрать

Стоит ли IT-компании разрабатывать ПО с нуля или лучше купить готовое решение?

Inc.
Агхори: зачем йоги едят человечину Агхори: зачем йоги едят человечину

Адепты этой религии совершают мистические ритуалы, связанные с трупами

Maxim
Глобализация по-азиатски: как Восток диктует моду, финансы и контент Глобализация по-азиатски: как Восток диктует моду, финансы и контент

Почему Запад больше не задает моду, а учится у Азии

Правила жизни
Анализ скопившегося за 2200 лет гуано указал на смену рациона андских кондоров Анализ скопившегося за 2200 лет гуано указал на смену рациона андских кондоров

Ученые реконструировали историю андских кондоров

N+1
По магнитной картинке мозга можно прочесть жесты человека. И безо всякой трепанации По магнитной картинке мозга можно прочесть жесты человека. И безо всякой трепанации

Магнитная картинка мозга позволила «прочитать» активность мозга без трепанации

ТехИнсайдер
Разрушитель порядка Разрушитель порядка

Попробуем нарисовать исторический портрет князя Потёмкина

Дилетант
Пять напитков, которыми нельзя запивать лекарства Пять напитков, которыми нельзя запивать лекарства

Почему нужно запивать лекарства только водой?

Здоровье
EELS: уникальный робот-змей NASA, который будет исследовать льды и огромный океан на луне Сатурна EELS: уникальный робот-змей NASA, который будет исследовать льды и огромный океан на луне Сатурна

JPL создала самоходную автономную роботизированную змею

ТехИнсайдер
Шум не мешает пониманию прочитанного, но влияет скорость чтения Шум не мешает пониманию прочитанного, но влияет скорость чтения

Влияние звукового и визуального шума на обработку информации во время чтения

ТехИнсайдер
Оставаться нельзя выбраться Оставаться нельзя выбраться

Как выйти из френдзоны

Лиза
На 5 градусов ближе к выздоровлению: как холод помогает сращивать сломанные кости? На 5 градусов ближе к выздоровлению: как холод помогает сращивать сломанные кости?

Чтобы вылечить, нужно заморозить

Вокруг света
Итальянский учёный определил, что за мост да Винчи изобразил сзади Мона Лизы Итальянский учёный определил, что за мост да Винчи изобразил сзади Мона Лизы

Сооружение позади Джоконды — мост Ромито ди Латерина

ТехИнсайдер
Как перестать опаздывать? Как перестать опаздывать?

«Синдром опаздывания»: почему он возникает и что с этим делать?

Psychologies
О чем думали люди в послевоенном 1947 году О чем думали люди в послевоенном 1947 году

Отрывок из книги Элисабет Осбринк «1947»

СНОБ
Нарушения менструального цикла связали с повышенным риском мерцательной аритмии Нарушения менструального цикла связали с повышенным риском мерцательной аритмии

Женщины с нерегулярным циклом более подвержены сердечно-сосудистым заболеваниям

N+1
«Чтобы заразиться, достаточно петтинга и орального секса». Врач-инфекционист — о рисках ВПЧ и прививке «Чтобы заразиться, достаточно петтинга и орального секса». Врач-инфекционист — о рисках ВПЧ и прививке

Как защититься от скрытой угрозы?

СНОБ
Кому и зачем нужна осиная талия Кому и зачем нужна осиная талия

Зачем насекомым тонкая талия?

Наука и жизнь
Катер из бутылок Катер из бутылок

Лодкам с электрическими моторами на boot Düsseldorf было отведено много места

Y Magazine
От прически до духов: что и почему (не) заводит мужчин От прически до духов: что и почему (не) заводит мужчин

Разбираемся в психологической, исторической, духовной природе пристрастий мужчин

Psychologies
7 ошибок в споре с рассерженным человеком 7 ошибок в споре с рассерженным человеком

Как вести себя с рассерженными людьми, чтобы не усугубить ситуацию?

Psychologies
Эль-Ниньо и Ла-Нинья случаются все чаще при глобальном потеплении Эль-Ниньо и Ла-Нинья случаются все чаще при глобальном потеплении

Глобальное потепление делает климат все более неустойчивым и непредсказуемым

ТехИнсайдер
Жирафы взвесили шансы и выбрали нужный контейнер Жирафы взвесили шансы и выбрали нужный контейнер

Маленький мозг не мешает жирафам мыслить статистически

N+1
Антисанкционный ответ. Первый тест-драйв новой Lada Vestа Антисанкционный ответ. Первый тест-драйв новой Lada Vestа

Тест-драйв новой Lada Vesta NG за 1,24 млн рублей

РБК
Мужчина 15 лет на больничном. Ему не повышают зарплату, и он подал в суд на работодателя Мужчина 15 лет на больничном. Ему не повышают зарплату, и он подал в суд на работодателя

Недовольный работник IT-компании больше 10 лет находится в больничном отпуске

ТехИнсайдер
Как блогеру не попасть под статью. Юридический чек-лист Как блогеру не попасть под статью. Юридический чек-лист

Какие у блогеров есть риски и как их снизить, чтобы не попасть под статью

Inc.
И Джаред Лето — гигантский кот: худшие образы звезд на Met Gala-2023 И Джаред Лето — гигантский кот: худшие образы звезд на Met Gala-2023

В этом году Бал Института костюма выдался богатным на «мемные» аутфиты

VOICE
Направленная эволюция: ученые сделали колонии дрожжей в 20 000 раз крупнее и в 10 000 раз прочнее Направленная эволюция: ученые сделали колонии дрожжей в 20 000 раз крупнее и в 10 000 раз прочнее

Ученые проводят долгосрочный эксперимент по эволюции в лабораторных условиях

ТехИнсайдер
Миссия: металл Миссия: металл

Зонд Psyche должен будет осмотреть целиком металлический мир

ТехИнсайдер
Открыть в приложении