Революция нейросетей произошла практически мгновенно, и на то есть причины

ТехИнсайдерHi-Tech

В начале было слово: как нейросети научились создавать искусство из букв и предложений

Сергей Цыпцын

7cf1d0ffb239bea875f94e42e2c9eb1f_ce_1024x681x0x171.png

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

c0cf3dc31c2991b243e7c7acc2365b3c.jpg
PROMPT: «Блондинка с короткой стрижкой, получеловек-полуандроид, обложка для научно-популярного журнала». Художник: Midjourney. DALL-E 2; Midjourney

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

bc48157d139e460eb607f3cfeea91129.png
Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей. Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E.  2DALL-E 2; Midjourney

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как спорт прокачивает мозг: физическая нагрузка для тренировки ума и памяти Как спорт прокачивает мозг: физическая нагрузка для тренировки ума и памяти

Что происходит с нашим мозгом, когда мы занимаемся спортом?

ТехИнсайдер
8 причин, почему вам следует использовать масло чайного дерева для дезинфекции дома 8 причин, почему вам следует использовать масло чайного дерева для дезинфекции дома

Вы удивитесь, когда узнаете, на что способно это средство!

ТехИнсайдер
Отличные фильмы Киану Ривза, которые ты мог забыть или не видел Отличные фильмы Киану Ривза, которые ты мог забыть или не видел

Культурная программа для вечера, посвященного Киану Ривзу

Maxim
Лето, прощай! Лето, прощай!

Как не столкнуться с таким понятием, как «постотпускной блюз»?

Лиза
Несчастливы по-своему: на экраны выходит новый фильм «Брат и сестра» с Марион Котийяр Несчастливы по-своему: на экраны выходит новый фильм «Брат и сестра» с Марион Котийяр

Удалось ли Арно Деплешену снять по-настоящему глубокую историю про семейные узы

Forbes
7 признаков, что вам не хватает витамина С 7 признаков, что вам не хватает витамина С

Получаете ли вы достаточное количество витамина С?

Inc.
Самый страшный маньяк Беларуси: история Игоря Миренкова, который ходил плакать на могилы жертв Самый страшный маньяк Беларуси: история Игоря Миренкова, который ходил плакать на могилы жертв

Перед смертью Миренков признавался: он ненавидит людей

VOICE
Остановись, будет хуже! От чего предостерегают пластические хирурги Остановись, будет хуже! От чего предостерегают пластические хирурги

Косметология и пластическая хирургия способны изменить нас до неузнаваемости

Лиза
Нейросеть Google предсказала запах молекул по их структуре Нейросеть Google предсказала запах молекул по их структуре

Исследовательская лаборатория Google Research представила карту основных запахов

N+1
Образ жизни Образ жизни

Дизайнер Татьяна Парфенова показывает нам свой новый дом, лес и сад

Собака.ru
Как стать астрофотографом и делать красивые снимки космоса: простая инструкция Как стать астрофотографом и делать красивые снимки космоса: простая инструкция

Астрофотография требует большой практики и большого терпения

ТехИнсайдер
Британские ученые развенчали миф о Британские ученые развенчали миф о

Как каннабис влияет на наш мозг?

ТехИнсайдер
9 философских принципов из книг, которые не дают упасть духом и помогают жить 9 философских принципов из книг, которые не дают упасть духом и помогают жить

Девять книг, которые познакомят вас с самыми важными философскими учениями

ТехИнсайдер
Знаток «Что? Где? Когда?» Дмитрий Авдеенко рассказал, как воспитывает с женой 5-летних тройняшек Знаток «Что? Где? Когда?» Дмитрий Авдеенко рассказал, как воспитывает с женой 5-летних тройняшек

Дмитрий Авдеенко раскрыл секреты воспитания сына и дочерей

VOICE
8 упражнений, которые не работают (и чем их заменить) 8 упражнений, которые не работают (и чем их заменить)

Не все спортивные упражнения одинаково полезны для фигуры

Лиза
Рэйография, редимейд, ракурс: как Ман Рэй изменил искусство Рэйография, редимейд, ракурс: как Ман Рэй изменил искусство

На примере пяти работ показываем, как Ман Рэй изменил фотографию и искусство

Правила жизни
Оральный секс: удовольствие или отвращение? Оральный секс: удовольствие или отвращение?

Почему многие считают отвратительным куннилингус и минет

Psychologies
Истребление человеком хищников разделило крупнейший в мире живой организм на три части Истребление человеком хищников разделило крупнейший в мире живой организм на три части

«Лес одного дерева» в Америке перестал возобновляться из-за избытка оленей

N+1
Как горевать без вреда для психического здоровья Как горевать без вреда для психического здоровья

Должны ли быть временные границы у горя?

Psychologies
Миллион нереализованных идей: как дать новую жизнь «похороненным» мечтам Миллион нереализованных идей: как дать новую жизнь «похороненным» мечтам

Мечта приходит, чтобы показать, чего мы хотим на самом деле

Psychologies
Застенчивость самцов альбатросов повысила риск их расставания с партнершами Застенчивость самцов альбатросов повысила риск их расставания с партнершами

Могут ли альбатроны стесняться и как это на них влиет?

N+1
Как возник в Санкт-Петербурге памятник Чижику-пыжику? Как возник в Санкт-Петербурге памятник Чижику-пыжику?

Памятник Чижику-пыжику — самый маленький монумент в Санкт-Петербурге

Культура.РФ
Что молодежь не знает о старом интернете Что молодежь не знает о старом интернете

Что молодые не знают, а бывалые не помнят об интернете

Maxim
Фотонные кольца черной дыры сохранили информацию о ее вибрациях Фотонные кольца черной дыры сохранили информацию о ее вибрациях

Фотонные кольца черной дыры имеют одинаковую конформную симметрию

N+1
Как мужчине выбрать себе украшение, а как — лучше не надо Как мужчине выбрать себе украшение, а как — лучше не надо

Браслеты, серьги и кольца: как выбрать мужское украшение?

Maxim
Вспомнить все: как запустить игры с Dendy и SEGA на ПК? Вспомнить все: как запустить игры с Dendy и SEGA на ПК?

Сегодня мы расскажем вам, как запустить игры с 8- и 16-битных консолей на ПК

CHIP
Такой, как она, больше нет: какой мы запомним королеву Елизавету II Такой, как она, больше нет: какой мы запомним королеву Елизавету II

Елизавета II — уникальная женщина в истории не только Великобритании, но и мира

VOICE
Спасение долгожителей Спасение долгожителей

Охотское море – самое южное место обитания холодолюбивых гренландских китов

ТехИнсайдер
5 овощей с самым высоким содержанием питательных веществ (научно доказано) 5 овощей с самым высоким содержанием питательных веществ (научно доказано)

Овощи с высоким содержанием питательных веществ

Inc.
Елизавета Моряк: Елизавета Моряк:

Умирать в кадре — это элемент творчества

Коллекция. Караван историй
Открыть в приложении