Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Виртуальный секс Виртуальный секс

«Популярная механика» протестировала первую в мире виртуальную любовницу

Популярная механика
5 вопросов, которые помогут достичь эмоциональной близости в отношениях 5 вопросов, которые помогут достичь эмоциональной близости в отношениях

Вопросы для определения уровня взаимопонимания и эмоциональной связи с партнером

Inc.
Цифровая лихорадка Цифровая лихорадка

Наиболее интересные выступления из конференции CG Event

Популярная механика
В поисках рифмы: каким получился музыкальный фильм про Пушкина с Юрой Борисовым В поисках рифмы: каким получился музыкальный фильм про Пушкина с Юрой Борисовым

Святослав Иванов рассказывает, каким получился байопик с Юрой Борисовым

Forbes
Побег с аэродрома Побег с аэродрома

Циклолеты – «летающие комбайны» – становятся экономичнее квадрокоптеров

Популярная механика
«Казус белых» на российском рынке вина «Казус белых» на российском рынке вина

На российском винном рынке красные вина постепенно уступают место белым

РБК
Выживут только инфорги Выживут только инфорги

«Инфорги» — люди, которые придут на смену Homo Sapiens

Популярная механика
Актив меж двух океанов Актив меж двух океанов

Как строили и распоряжались Панамским каналом

Деньги
Чистое золото Чистое золото

В компании «Полиметалл» добывают золото без вреда для природы

ТехИнсайдер
Японцы сделали роборуку с человеческими мышцами Японцы сделали роборуку с человеческими мышцами

Японские инженеры разработали биогибридную руку с человеческими мышцами

N+1
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
Страшно влиятельный доктор Страшно влиятельный доктор

Из чего 105 лет назад появился первый хоррор

Weekend
Суперприложение Суперприложение

В Поднебесной вся коммуникация идет через систему WeChat

ТехИнсайдер
Тянут на себя Тянут на себя

Типаж у этих актеров разный, а сила их харизмы примерно одинакова

VOICE
Услышав имя, улыбнись! Услышав имя, улыбнись!

Это ползучка живучая? Нет, это живучка ползучая!

Наука и жизнь
Молодость навсегда Молодость навсегда

Важные бьюти-ингредиенты, которые помогают нам дольше оставаться молодыми

Лиза
Как Египет заработал на раскопки Как Египет заработал на раскопки

Гробница KV 62 остается единственным не разграбленным погребением в Долине Царей

Наука
Дымзавесы и перцовый газ: как оборонка СССР создавала противоугонные системы Дымзавесы и перцовый газ: как оборонка СССР создавала противоугонные системы

Охранная система, которая работала по принципу газового оружия, существовала

ТехИнсайдер
Верхом на вихре Верхом на вихре

Возможное будущее гражданской авиации

Популярная механика
Алло, гараж! Алло, гараж!

Как, зачем и для кого в России создают мотоциклы на заказ

Men Today
Дмитрий Лысенков: «Главное – это неравнодушие» Дмитрий Лысенков: «Главное – это неравнодушие»

Дмитрий Лысенков — о том, почему не всегда оправдывает злодеев, которых играет

Ведомости
Знакомство с сапиенсами Знакомство с сапиенсами

Что случилось же 50 тысяч лет назад? Интереснейшие находки в Денисовой пещере

Afternoon Seasons of life
Встречают по одежке? Встречают по одежке?

Что скрывается за этикеткой бутылки и как дизайн влияет на восприятие продукта

РБК
Часы в России встали Часы в России встали

Рынок умных часов перешел к умеренному росту в темпе потребительской инфляции

Ведомости
И не говори… И не говори…

Несколько фраз, которые могут испортить свидание с мужчиной

Лиза
Черная королева русского андеграунда. Какой была Наталия Медведева Черная королева русского андеграунда. Какой была Наталия Медведева

Насколько интересны романы и стихи Наталии Медведевой в отрыве от ее биографии

СНОБ
Мирные переговоры войне не помеха Мирные переговоры войне не помеха

История завершения военных конфликтов с участием СССР и США

Монокль
«Нельзя быть безразличным к своей профессии» «Нельзя быть безразличным к своей профессии»

Энолог винодельни «СоберБаш» о важности рейтингов и выборе профессии

РБК
«Насилие. Микросоциологическая теория» «Насилие. Микросоциологическая теория»

Как перестрелки вытеснили честные поединки

N+1
В поисках частиц темной материи В поисках частиц темной материи

Три основные гипотезы о том, что представляют собой частицы темной материи

Знание – сила
Открыть в приложении