Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Технопарад Технопарад

Линзы с AR, новая ракета Nasa Space Launch System и запись звуков на Марсе

ТехИнсайдер
Финкульт-привет Финкульт-привет

Низкая финграмотность — вызов не только для клиентов, но и для банков

Ведомости
Выживут только инфорги Выживут только инфорги

«Инфорги» — люди, которые придут на смену Homo Sapiens

Популярная механика
Компьютерное зрение: когда роботы перестали тыкать пальцем в небо? Компьютерное зрение: когда роботы перестали тыкать пальцем в небо?

Зачем нужно компьютерное зрение и какие задачи оно решает в разных сферах

Наука и техника
Этого не может быть Этого не может быть

Самые удивительные гипотезы в биологии

ТехИнсайдер
Любовь к животным и санкции Любовь к животным и санкции

Почему рынок кормов — перспективное направление для инвестиций

Агроинвестор
Мы из будущего Мы из будущего

«Белая Вежа» — один из самых интересных научных центров

ТехИнсайдер
Группы, в которых не менялся состав. Никогда Группы, в которых не менялся состав. Никогда

Группы, в которых состав отличается своей стабильностью

Maxim
Побег с аэродрома Побег с аэродрома

Циклолеты – «летающие комбайны» – становятся экономичнее квадрокоптеров

Популярная механика
Самый секретный агент Самый секретный агент

Из чего сделан мир Джеймса Бонда Яна Флеминга

Weekend
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
Самоубийство семьи бургомистра Самоубийство семьи бургомистра

«Кризис закончен. Орудия затихли. Кто знал, как нам стоит поступить?»

Дилетант
Следствие ведут биохимики Следствие ведут биохимики

Здесь хранятся уникальные артефакты, связанные с событиями последних веков...

ТехИнсайдер
Почему машина заводится и глохнет и что с этим делать Почему машина заводится и глохнет и что с этим делать

Что делать, если машина глохнет: причины, диагностика, куда смотреть

РБК
Гонка за орбитальный кинематограф Гонка за орбитальный кинематограф

Зачем снимать кино в космосе, если есть компьютерная графика?

Популярная механика
Есть на что строить Есть на что строить

Зачем создавать отдельный механизм финансирования — инфраструктурные облигации?

Монокль
Арктический город будущего Арктический город будущего

Реальные технологии строительства в Арктике приходили из Норильска

ТехИнсайдер
Любовь, сбивающая с ног: 10 культовых фильмов про свадьбы Любовь, сбивающая с ног: 10 культовых фильмов про свадьбы

Фильмы о свадьбе, которые заставят вас смеяться и плакать

Правила жизни
Время для счастья Время для счастья

Эти женщины доказывают, что можно оставаться привлекательными в любом возрасте

Добрые советы
Развод и утрата: как справиться с последствиями Развод и утрата: как справиться с последствиями

Как утрата влияет на наше психологическое состояние?

VOICE
Объединяя народы Объединяя народы

Летний уикенд в Казани — что посмотреть в столице Татарстана?

Отдых в России
Михаил Бахтин Михаил Бахтин

Зачем Бахтин понадобился Андропову и почему он так известен в Европе и Штатах?

Дилетант
Жизнь Васи Ложкина Жизнь Васи Ложкина

Художник Вася Ложкин: котики, музыка, театральная сцена

Отдых в России
Хирургия без шрамов: как появилась лапароскопия Хирургия без шрамов: как появилась лапароскопия

Как и когда хирургия стала щадящей?

ТехИнсайдер
«Герофарм» продолжает экспансию на глобальный рынок «Герофарм» продолжает экспансию на глобальный рынок

Петр Родионов — о том, как вырос один из флагманов импортозамещения

Монокль
Без диплома, но с работой Без диплома, но с работой

Почему студенты колледжей бросают учебу?

Ведомости
Жизнь за стеной Жизнь за стеной

Фильм про страну, в которой тотальный контроль стал религией

Дилетант
6 бытовых привычек, из-за которых в доме плохо пахнет 6 бытовых привычек, из-за которых в доме плохо пахнет

Некоторые из этих вещей вы совершаете ежедневно, а они влияют на запах в доме

ТехИнсайдер
Кризис нэпа Кризис нэпа

100 лет тому назад страна жила в атмосфере «правого коммунизма»

Дилетант
Экологическая модернизация Экологическая модернизация

Как разные страны переосмысливают управление органическими отходами

Агроинвестор
Открыть в приложении