Ученые создали инструмент для редактирования объектов на изображении

N+1Hi-Tech

Нейросеть получила удобный интерфейс редактирования изображений

Он напоминает редактор внешности в видеоиграх

Виктория Земляк

40c394a560f62d417ec8c9208cc0404f.gif
Пример работы DragGAN. Theobalt et al. / arXiv, 2023

Ученые из США и Германии создали инструмент для редактирования объектов на изображении DragGAN. Он основан на нейросети, которая на лету генерирует новые изображения. Пользователь может отмечать мышкой разные элементы на фотографии, и они реалистично перемещаются, поворачиваются, растягиваются и уменьшаются — похожий подход нередко используют в видеоиграх для редактирования внешности персонажа. Препринт доступен на arXiv.org.

В последние пару лет случился бум диффузионных нейросетей для генерации изображений по текстовым запросам — например, Stable Diffusion, DALL-E и Midjourney. Диффузионная модель умеет генерировать реалистичные изображения из случайного шума, а текстовое описание подсказывает модели, что именно должно быть на изображении. Но есть проблема: диффузионные нейросети недостаточно точны и не подходят, если нужно выполнить очень конкретную задачу при редактировании: сдвинуть объект на несколько пикселей в определенную сторону или повернуть его на определенное количество градусов.

Задачу точного редактирования изображений можно решить с помощью других нейросетевых архитектур. Например, до появления диффузионных нейросетей часто использовали GAN — генеративно-состязательные сети. Такая модель состоит из двух нейросетей: генеративной и состязательной. По сути две нейросети соревнуются друг с другом: состязательная сеть учится отличать реальные изображения от сгенерированных, а генеративная, в свою очередь, пытается сгенерировать максимально реалистичные изображения из случайного шума (на этой идее основаны и диффузионные модели). Состязательная сеть посылает сигнал генеративной модели — сообщает ей, насколько реалистичное получилось изображение. И так до тех пор, пока генеративная сеть не научится обманывать состязательную.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Базальтовые бусины в невесомости подтвердили вклад трибоэлектричества в формирование планет Базальтовые бусины в невесомости подтвердили вклад трибоэлектричества в формирование планет

Зачем ученые отправили в суборбитальный полет кучку базальтовых бусин

N+1
Для комаров создали Для комаров создали

Комары, по-видимому, предпочитают определенные особенные человеческие запахи

ТехИнсайдер
Как ИИ копирует голоса и помогает мошенникам вымогать деньги Как ИИ копирует голоса и помогает мошенникам вымогать деньги

Как мошенники используют уникальную способность нейросетей к копированию голоса

Inc.
Как подключить второй монитор к компьютеру и зачем это делать Как подключить второй монитор к компьютеру и зачем это делать

Многие пользователи задумываются о том, как подключить два монитора к компьютеру

CHIP
Я вижу, о чем вы думаете Я вижу, о чем вы думаете

Как агенты ФБР читают людей

kiozk originals
Вот почему с годами кажется, что время идет быстрее! А вы это замечали? Вот почему с годами кажется, что время идет быстрее! А вы это замечали?

Восприятие времени сильно меняется по мере старения

ТехИнсайдер
Покупка подержанной Mazda CX-5 Покупка подержанной Mazda CX-5

Наш нынешний герой – кроссовер Mazda CX-5

4x4 Club
Может ли пупок развязаться? Может ли пупок развязаться?

Зачем человеку пупок и почему все думают, что он может развязаться?

ТехИнсайдер
Аккреционный диск черной дыры воссоздали без стенок в лаборатории Аккреционный диск черной дыры воссоздали без стенок в лаборатории

Британские и американские физики создали лабораторный аналог аккреционного диска

N+1
Проверяйте ответы ChatGPT: его надежность пока на низком уровне Проверяйте ответы ChatGPT: его надежность пока на низком уровне

Ученые проверили надежность ответов, которые дают генеративные поисковые системы

ТехИнсайдер
Колхоз – дело добровольное Колхоз – дело добровольное

Как в Советском Союзе «колхозили» запчасти для иностранных автомобилей

Автопилот
Хозяйкам на заметку: 5 удивительных методов использования дрожжей, о которых вы и не догадывались Хозяйкам на заметку: 5 удивительных методов использования дрожжей, о которых вы и не догадывались

Дрожжи можно использовать не только в кулинарии!

ТехИнсайдер
Марафон несчастий: что делать блогерам, к которым еще не пришли из ФНС Марафон несчастий: что делать блогерам, к которым еще не пришли из ФНС

В ФНС уже создан специальный отдел по проверке российских блогеров

Forbes
Кому и зачем нужна осиная талия Кому и зачем нужна осиная талия

Зачем насекомым тонкая талия?

Наука и жизнь
Достопримечательности Земли обетованной: 7 удивительных чудес Израиля, которые должен увидеть каждый Достопримечательности Земли обетованной: 7 удивительных чудес Израиля, которые должен увидеть каждый

Эти места почитаются святыми в иудаизме, христианстве и исламе

Вокруг света
Как эволюционная случайность навсегда изменила мозг человека: один шанс на миллион Как эволюционная случайность навсегда изменила мозг человека: один шанс на миллион

Почему ДНК людей за короткий эволюционный промежуток времени вдруг изменилась?

ТехИнсайдер
Саудовская Аравия платит спортсменам миллионы и меняет правила игры Саудовская Аравия платит спортсменам миллионы и меняет правила игры

Щедрые участники рынка футбола могут уничтожать конкуренцию

Forbes
Пять болевых точек российских финансов: что тревожит ЦБ и аналитиков Пять болевых точек российских финансов: что тревожит ЦБ и аналитиков

Банк России назвал пять главных уязвимостей финансового сектора России

Forbes
Почему женщины ненавидят друг друга: 3 причины Почему женщины ненавидят друг друга: 3 причины

Что побуждает женщин соревноваться друг с другом — даже при хороших отношениях?

Psychologies
Магические законы денег: притягиваем финансовое благополучие Магические законы денег: притягиваем финансовое благополучие

Как действовать, чтобы деньги на счету и в кошельке никогда не переводились?

VOICE
«Ковер» Тальбота помог упорядоченно пленить десять тысяч атомов «Ковер» Тальбота помог упорядоченно пленить десять тысяч атомов

Показана технология создания оптических решеток на основе эффекта Тальбота

N+1
«Олейну» разливает новый собственник «Олейну» разливает новый собственник

Последний российский актив Bunge продан с 50 %-ным дисконтом

Агроинвестор
Вот почему город Кито стал первым в списке наследия ЮНЕСКО. Стоит узнать! Вот почему город Кито стал первым в списке наследия ЮНЕСКО. Стоит узнать!

В списке ЮНЕСКО столица Эквадора оказалась не просто так

ТехИнсайдер
Индустрия впечатлений: что такое авторские туры и кому они нужны Индустрия впечатлений: что такое авторские туры и кому они нужны

Как появились авторские туры и чем они примечательны

РБК
Когда можно сесть за руль после алкоголя: сколько промилле разрешено Когда можно сесть за руль после алкоголя: сколько промилле разрешено

Как определить, когда после застолья можно садиться за руль?

РБК
Зачем вам нужна «психическая броня», и что это такое: стоит узнать! Зачем вам нужна «психическая броня», и что это такое: стоит узнать!

Мы можем подготовиться, чтобы более эффективно справляться с трудностями в жизни

ТехИнсайдер
«Сам никакой связи со своим поколением я не чувствую» «Сам никакой связи со своим поколением я не чувствую»

Только на вторых пробах я почувствовал, что герой во мне рисуется и рождается

OK!
Изменить жизнь, отказавшись от сахара Изменить жизнь, отказавшись от сахара

К чему может привести отказ от сахара? Рассказывают наши героини

Здоровье
Японская философия «ваби-саби»: как принять несовершенство мира Японская философия «ваби-саби»: как принять несовершенство мира

Как же перестать гнаться за идеалами и начать жить здесь и сейчас?

Psychologies
Виды на балкон Виды на балкон

Зелень и овощи лучше выращивать на дачных грядках, но вполне подойдет и балкон

Лиза
Открыть в приложении