Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Анатомия робособаки Анатомия робособаки

Выверенная анатомия Spot — продукт не слепой эволюции, а грамотной инженерии

ТехИнсайдер
Что такое ИИ-агент, и чем он отличается от обычной нейросети? Что такое ИИ-агент, и чем он отличается от обычной нейросети?

ИИ-агенты сильно упростят нам жизнь — если, конечно, научатся корректно работать

CHIP
«Глаза» для беспилотников «Глаза» для беспилотников

Автомобили с круглой нашлепкой на крыше сегодня на дорогах уже не редкость

Популярная механика
Вечная молодость: 7 легендарных внедорожников, которые выпускались более 20 лет Вечная молодость: 7 легендарных внедорожников, которые выпускались более 20 лет

Автотитаны, которые десятилетиями остаются на конвейере

4x4 Club
Слайд-шоу Слайд-шоу

Объединенный исследовательский центр, машина для доставки и спортивный катер

ТехИнсайдер
В сосновом бору В сосновом бору

Настоящий гимн природе в интерьере загородного дома в пригороде Новосибирска

SALON-Interior
Автобудущее Автобудущее

Мы находимся на пороге одних из самых быстрых перемен в работе транспорта

Популярная механика
Дэвид Хокни: большой всплеск Дэвид Хокни: большой всплеск

В 88 лет Дэвид Хокни сумел остаться актуальным в XXI веке

Монокль
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
Почему свистит ремень генератора и как его проверить Почему свистит ремень генератора и как его проверить

Свистит ремень генератора: что делать и как проверить

РБК
Испытание делом Испытание делом

Экзоскелеты появляются в новостях нечасто и кажутся вещью из будущего

ТехИнсайдер
От Чувака до Гарфилда: 13 киногероев, которые сделали лень культовой От Чувака до Гарфилда: 13 киногероев, которые сделали лень культовой

Киногерои, чье бездействие стало зеркалом тревог и надежд целых поколений

Правила жизни
Норманны vs славяне. 300-летняя война Норманны vs славяне. 300-летняя война

Кого призвали старейшины: братьев-славян или братьев-варягов?

Дилетант
Жизнь без гаджетов Жизнь без гаджетов

Как прекратить сидеть в телефоне: 9 шагов к цифровой свободе

Лиза
Врангели Врангели

Баронский род Врангелей оставил глубокий след в истории России

Дилетант
Цифровой «наставник»: почему бизнесу выгоднее обучать, а не увольнять сотрудников Цифровой «наставник»: почему бизнесу выгоднее обучать, а не увольнять сотрудников

Переквалификация превращается в главный инструмент устойчивости компаний

Forbes
Драгоценное зернышко Драгоценное зернышко

Золотодобыча в современных условиях

Популярная механика
Ложные вампиры обнялись и поделились друг с другом пищей Ложные вампиры обнялись и поделились друг с другом пищей

Социальное поведение ложныех вампиров оказалось неожиданно сложным

N+1
Ускользающие инопланетяне Ускользающие инопланетяне

Новая шкала инопланетных цивилизаций

Популярная механика
Доставка опережает Доставка опережает

Из-за чего этот труд курьеров перестает быть высокооплачиваемым

Ведомости
Московский оазис Московский оазис

Интерьер апартаментов, вдохновленный панорамными видами на живописный парк

SALON-Interior
У горных горилл насчитали шестьдесят три жеста У горных горилл насчитали шестьдесят три жеста

Ученые описали жестовый репертуар диких горных горилл

N+1
«Если никто не спрашивает, то и отвечать не нужно» «Если никто не спрашивает, то и отвечать не нужно»

Карл Густав Юнг о том, что он узнал о людях

Weekend
Искусство момента и вечности Искусство момента и вечности

Книги об истории и философии искусства, о вдохновленных и вдохновлявшем

Weekend
Масляное коварство Масляное коварство

Как масло для дерева может стать причиной пожара?

Наука и жизнь
Что делать, если бизнес приносит убытки Что делать, если бизнес приносит убытки

Какие шаги помогут стабилизировать ситуацию, если предприятие работает в минус

Inc.
Пора в дорогу, старина: 7 книг, которые помогут настроиться на путешествие Пора в дорогу, старина: 7 книг, которые помогут настроиться на путешествие

Подборка книг о разных городах, заповедных местах и самой сути туризма

Правила жизни
Гипоаллергенная диета: что включить в меню Гипоаллергенная диета: что включить в меню

Справиться с аллергией можно не только с помощью лекарств

Лиза
Быстрые и буйные Быстрые и буйные

Как фристайл-мотокросс появился в России?

Men Today
De_Dust 2 и Ярнам: как локации в играх становятся легендарными De_Dust 2 и Ярнам: как локации в играх становятся легендарными

В чем секрет легендарных гейм-локаций? Как удается создавать эти «места силы»?

Maxim
Открыть в приложении