Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Магомет идет к горе Магомет идет к горе

Мобильная станция, в которой содержится около 7–8 т различных видов масел

Популярная механика
Переосмыслить Петербург: как архитектура и фотография  помогут увидеть город по-новому Переосмыслить Петербург: как архитектура и фотография  помогут увидеть город по-новому

Архитектура может быть не только функциональной, но и трогательной

VOICE
Технопарад Технопарад

Линзы с AR, новая ракета Nasa Space Launch System и запись звуков на Марсе

ТехИнсайдер
За белым солнцем За белым солнцем

Белые ночи, Новый год, летний лед:  что еще возможно в июне в Якутии?

Новый очаг
Цифровая лихорадка Цифровая лихорадка

Наиболее интересные выступления из конференции CG Event

Популярная механика
Стресс в наследство Стресс в наследство

Как на ребенка влияет стресс матери во время беременности?

Здоровье
Еда, которая не убивает планету Еда, которая не убивает планету

Прокормить постоянно растущее человечество помогут микроорганизмы

ТехИнсайдер
Я работаю мамой Я работаю мамой

Валентина Красникова, мама 17 детей, о семье и хобби

Лиза
Чистое золото Чистое золото

В компании «Полиметалл» добывают золото без вреда для природы

ТехИнсайдер
10 самых засмотренных до дыр мультфильмов разных поколений 10 самых засмотренных до дыр мультфильмов разных поколений

Самые засмотренные мультфильмы за все время, разбитые по десятилетиям

Maxim
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
Режиссер Леонид Хейфец. Откровенно о Дорониной, Миронове и Борисове Режиссер Леонид Хейфец. Откровенно о Дорониной, Миронове и Борисове

Когда Ефремов пригласил меня, МХАТ как раз «пилился»

Коллекция. Караван историй
Земля переезжает Земля переезжает

Когда Солнце начнет затухать, корабль «Земля» уже прибудет к новой звезде

Популярная механика
Над всей Испанией безоблачное небо Над всей Испанией безоблачное небо

Как восемь гигаватт «погасили» электрическую сеть Пиренейского полуострова

Монокль
Авианосцы постройки Великобритании и Франции. Часть 1. Великобритания Авианосцы постройки Великобритании и Франции. Часть 1. Великобритания

Королева Элизабет и её свита

Наука и техника
«Зона комфорта — это плохо»: большое интервью со Словетским «Зона комфорта — это плохо»: большое интервью со Словетским

Валентин Словетский — классик русского рэпа. Поговорили с ним о новом альбоме

Правила жизни
Слова вместо нот Слова вместо нот

Генеративная музыка: как создать хит по собственному вкусу

ТехИнсайдер
Как отмыть увлажнитель воздуха от накипи и налета Как отмыть увлажнитель воздуха от накипи и налета

Как почистить увлажнитель воздуха от накипи, чтобы он радовал вас чистым паром

CHIP
Строители невидимых путей Строители невидимых путей

Как устроен морской порт

Популярная механика
«Почему мы помним. Как раскрыть способность памяти удерживать важное» «Почему мы помним. Как раскрыть способность памяти удерживать важное»

Как гиппокамп участвует в работе памяти

N+1
Вадим Верник: «Я спросил у Вишневской: «Вы приручили Ростроповича?» Вадим Верник: «Я спросил у Вишневской: «Вы приручили Ростроповича?»

Мне хотелось поговорить с этими легендарными людьми по душам

Коллекция. Караван историй
Минус вайб Минус вайб

Чем опасно доверять написание кода нейросетям?

N+1
Просто добавь воды Просто добавь воды

Химики предложили новый способ стабилизации наночастиц оксида железа

Наука и жизнь
Изогнутый экран смартфона — это удобно? Изогнутый экран смартфона — это удобно?

Стоит ли покупать смартфоны с изогнутыми экранами?

CHIP
Янская стоянка. Палеолитический человек за полярным кругом Янская стоянка. Палеолитический человек за полярным кругом

Янская стоянка — самые северные следы Homo sapiens в Арктике

Наука и техника
Победа и Наука. Взгляд из Сибири Победа и Наука. Взгляд из Сибири

Война стала высшей точкой слияния науки и государства

Знание – сила
О наследии Стефана Пермского О наследии Стефана Пермского

Кто может считаться первым исследователем истории и культуры коми народа?

Знание – сила
Лазеры решат проблему ядовитой пыли от автомобильных тормозов Лазеры решат проблему ядовитой пыли от автомобильных тормозов

Brembo сократил количество ядовитой пыли от тормозов в 5 раз

ТехИнсайдер
Как выбрать брокера Как выбрать брокера

Как выбрать яхтенного брокера и избежать ошибок?

Y Magazine
Медоуказчики привели людей к змеям по ошибке Медоуказчики привели людей к змеям по ошибке

Орнитологи выяснили, почему большие медоуказчики иногда направляют людей к змеям

N+1
Открыть в приложении