Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Гидрофойл для миллионов Гидрофойл для миллионов

Гидрофойл – доска на подводных крыльях для серфинга

Популярная механика
Сергей Довлатов: зумер среди классиков Сергей Довлатов: зумер среди классиков

О роли Сергея Довлатова в литературе и причинах его современности

Правила жизни
Транспорт будущего Транспорт будущего

Вот уже шесть лет мы пишем про летающие автомобили и стоим рядом с прототипами

ТехИнсайдер
Кто даст мне сто долларов? Кто даст мне сто долларов?

Аукционные дома Sotheby’s и Christie’s: инструкция по применению

Weekend
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
Потепление океана оказалось угрозой для бактериального фотосинтеза Потепление океана оказалось угрозой для бактериального фотосинтеза

Вода теплее 28 градусов приведет к коллапсу популяций цианобактерий

N+1
Мы из будущего Мы из будущего

«Белая Вежа» — один из самых интересных научных центров

ТехИнсайдер
Скороварка эволюции: как городская жизнь изменила вид и повадки животных и насекомых Скороварка эволюции: как городская жизнь изменила вид и повадки животных и насекомых

Как меняются животные и растения в городах

Forbes
Автобудущее Автобудущее

Мы находимся на пороге одних из самых быстрых перемен в работе транспорта

Популярная механика
Вода в топливном баке: чем опасна, как убрать и чем это лучше сделать Вода в топливном баке: чем опасна, как убрать и чем это лучше сделать

Как действовать, если вода в значимых количествах попала в бензобак?

РБК
Этого не может быть Этого не может быть

Самые удивительные гипотезы в биологии

ТехИнсайдер
«Стекло в пуантах — прошлый век» «Стекло в пуантах — прошлый век»

Почему в профессии балерины так важны верные партнеры и любовь к своему делу

OK!
Сталин и генералы Сталин и генералы

В отношениях с красными генералами Сталин сочетал мстительность и утилитарность

Дилетант
Последнее думающее поколение. Кто на самом деле воспитывает наших детей Последнее думающее поколение. Кто на самом деле воспитывает наших детей

Как ИИ становится цифровым воспитателем

Inc.
Самый большой магнит в мире Самый большой магнит в мире

Самый массивный и мощный на планете магнит – центральный соленоид

Популярная механика
Чем известен убитый союзник Дональда Трампа Чарли Кирк Чем известен убитый союзник Дональда Трампа Чарли Кирк

Мученик-трампист Чарли Кирк был консерватором, популярным среди молодежи

Ведомости
Со мной одной крови Со мной одной крови

Сева Кущинский передает привет из вены с любовью

Men’s Health
Тихая охота Тихая охота

Как правильно и безопасно собирать грибы осенью

Лиза
За урожаем из глубин За урожаем из глубин

На разных верфях страны бум рыбопромыслового судостроения

Популярная механика
Пластыри от прыщей: как они устроены и действительно ли помогают избавиться от высыпаний Пластыри от прыщей: как они устроены и действительно ли помогают избавиться от высыпаний

Работают ли патчи от прыщей или это просто маркетинг?

ТехИнсайдер
Озерный край Озерный край

Пресс-тур по Псковской области: полторы тысячи километров

Отдых в России
Я тебя понимаю Я тебя понимаю

Когда рядом есть люди, которые могут выслушать и понять, это и есть эмпатия

Лиза
Давление на автозаймы Давление на автозаймы

Что мешает автокредитам набирать обороты

Деньги
Разговорились по деньгам: отчего растет российский финтех Разговорились по деньгам: отчего растет российский финтех

Встроенные финансы — новый стандарт клиентского пути

Forbes
Такие деловые: зачем бизнесу этикет Такие деловые: зачем бизнесу этикет

Нужен ли сегодня бизнес-этикет, если можно просто встретиться за чашкой кофе?

Grazia
«Хаббл» увидел пару из белого карлика и голубого бродяги «Хаббл» увидел пару из белого карлика и голубого бродяги

«Хаббл» подтвердил рождение голубого бродяги от пары с белым карликом

N+1
Использование нейросетей может угрожать бизнесу Использование нейросетей может угрожать бизнесу

Бизнес и ИИ: какие риски связаны с использованием нейросетей

Inc.
Внедрение ИИ в России: «Мы движемся к точке невозврата» Внедрение ИИ в России: «Мы движемся к точке невозврата»

ИТ-эксперт о необходимых законах об ИИ и угрозах бесконтрольной цифровизации

ФедералПресс
Астрономы нашли наиболее вероятного кандидата в беззвездное гало темной материи субгалактической массы Астрономы нашли наиболее вероятного кандидата в беззвездное гало темной материи субгалактической массы

Астрономы подтвердили статус Cloud-9 как кандидата в объекты типа RELHIC

N+1
Девелоперы избавляются от офисов Девелоперы избавляются от офисов

Объем офисов на продажу в Москве за год увеличился более чем на треть

Ведомости
Открыть в приложении