Революция нейросетей произошла практически мгновенно, и на то есть причины

ТехИнсайдерHi-Tech

В начале было слово: как нейросети научились создавать искусство из букв и предложений

Сергей Цыпцын

7cf1d0ffb239bea875f94e42e2c9eb1f_ce_1024x681x0x171.png

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

c0cf3dc31c2991b243e7c7acc2365b3c.jpg
PROMPT: «Блондинка с короткой стрижкой, получеловек-полуандроид, обложка для научно-популярного журнала». Художник: Midjourney. DALL-E 2; Midjourney

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

bc48157d139e460eb607f3cfeea91129.png
Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей. Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E.  2DALL-E 2; Midjourney

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Измеряйте самое важное Измеряйте самое важное

Как Google, Intel и другие компании добиваются роста с помощью OKR

kiozk originals
«Счастье — это когда тебя понимают»: отрывок из книги Станислава Ростоцкого «Счастье — это когда тебя понимают»: отрывок из книги Станислава Ростоцкого

Глава из книги «Счастье — это когда тебя понимают» Станислава Ростоцкого

СНОБ
Как защититься от обид? Перестать придавать значение мнению окружающих Как защититься от обид? Перестать придавать значение мнению окружающих

Как помочь ребенку (да и взрослому тоже) справиться с психологическим давлением

Psychologies
«Беги, прячься, дерись» — инструкция на случай шутинга от спецслужб «Беги, прячься, дерись» — инструкция на случай шутинга от спецслужб

Эффективная инструкция по противодействию стрелкам

Maxim
За себя и за того парня За себя и за того парня

Как перестать работать за других

Лиза
Насильственная психотерапия: Стив Карелл в новом сериале о внутреннем мире маньяков Насильственная психотерапия: Стив Карелл в новом сериале о внутреннем мире маньяков

«Пациент» — психологический триллер о психотерапевте

Forbes
Киберпанк собачий! Тестируем робота-курьера о четырех ногах на улицах Москвы Киберпанк собачий! Тестируем робота-курьера о четырех ногах на улицах Москвы

Протестировали шагающего робота Alien Go и чуть не устроили ДТП!

ТехИнсайдер
Под кодом крови Под кодом крови

Собираешься сдать анализы?

Лиза
Мир наизнанку Мир наизнанку

Брейгель – художник, но слова в его работах играли не только роль названий

Вокруг света
Метаанализ выявил поражения мозга при обезьяньей оспе Метаанализ выявил поражения мозга при обезьяньей оспе

Оспа обезьян может вызывать судороги, спутанность сознания и энцефалит

N+1
Как добывают уран: самый рискованный бизнес Как добывают уран: самый рискованный бизнес

Какой уран добывают их рабочие, и как можно его использовать?

ТехИнсайдер
Азбука здоровья Азбука здоровья

На вопросы о винирах отвечает стоматолог-ортопед

VOICE
Не последний человек: что мы знаем о новой принцессе Уэльской Не последний человек: что мы знаем о новой принцессе Уэльской

Так ли идеальна на самом деле новая принцесса Уэльская

Правила жизни
В зубном камне жертв майя из пещеры «Полуночного ужаса» нашли синие хлопковые волокна В зубном камне жертв майя из пещеры «Полуночного ужаса» нашли синие хлопковые волокна

Ученые исследовали зубы, найденные в пещере «Полуночного ужаса»

N+1
«Математическое неравенство»: почему до сих пор так мало женщин в IT и точных науках «Математическое неравенство»: почему до сих пор так мало женщин в IT и точных науках

Как помочь следующему поколению девочек не становиться жертвами клише

Forbes
4 способа легче переживать неприятные события 4 способа легче переживать неприятные события

Можно ли принять плохие эмоции, не увязнув в бесконечных сожалениях?

Psychologies
Дебош в похоронном бюро, столпотворение в Париже и прощание с Дианой: самые дорогие, масштабные и экстравагантные похороны за последние 150 лет Дебош в похоронном бюро, столпотворение в Париже и прощание с Дианой: самые дорогие, масштабные и экстравагантные похороны за последние 150 лет

Самые массовые и экстравагантные церемония прощания

Правила жизни
10 культовых вещей из кино. Часть первая, мужская 10 культовых вещей из кино. Часть первая, мужская

Вспоминаем знаменитые куртки, пальто и костюмы мирового кинематографа

Правила жизни
Как определить тип волос и подобрать правильный уход Как определить тип волос и подобрать правильный уход

Поддерживать красоту волос несложно, но для начала следует определить их тип

РБК
Секс в семье с маленькими детьми: 3 правила для родителей Секс в семье с маленькими детьми: 3 правила для родителей

Секс в паре должен быть независимо от того, есть ли у вас дети или нет

Psychologies
Путь длиной в 96 лет: какие технологии появились при Елизавете II Путь длиной в 96 лет: какие технологии появились при Елизавете II

Вспоминаем эпохальные технологии, которые застала при жизни Елизавета II

CHIP
Фрагмент книги Михаила Горбачева «Остаюсь оптимистом» — о студенческой жизни будущего единственного президента СССР Фрагмент книги Михаила Горбачева «Остаюсь оптимистом» — о студенческой жизни будущего единственного президента СССР

Фрагмент автобиографической книги Михаила Горбачева «Остаюсь оптимистом»

Правила жизни
Почему затонувший Почему затонувший

Почему лайнер "Титаник" до сих пор лежит на дне?

ТехИнсайдер
Екатерина Климова: «Надо либо двигаться дальше, либо отходить в сторону» Екатерина Климова: «Надо либо двигаться дальше, либо отходить в сторону»

По себе знаю, что либо артиста рвут на части, либо он никому не интересен

Караван историй
Защита экологии и поддержка фермеров: во что верит и за что борется Карл III Защита экологии и поддержка фермеров: во что верит и за что борется Карл III

Forbes Life рассказывает о взглядах Его величества на мироустройство

Forbes
От Пхеньяна до Сеула. И обратно От Пхеньяна до Сеула. И обратно

Ситуация на фронтах Корейской войны менялась с калейдоскопической скоростью

Дилетант
5 способов быстро проверить штрафы онлайн: инструкция к применению 5 способов быстро проверить штрафы онлайн: инструкция к применению

Как минимизировать финансовые затраты, потерю времени и нервов при уплате штрафа

РБК
Живут в кипятке миллионы лет и лакомятся нефтью: что нам известно о самых живучих существах на Земле? Живут в кипятке миллионы лет и лакомятся нефтью: что нам известно о самых живучих существах на Земле?

«Микроб не гризли, ошейник не наденешь», — говорят о термофилах биологи

Вокруг света
Автомобили Автомобили

Отрадно, что все сюрпризы в автомобилестроении исключительно приятные

Robb Report
«Купчихи, дворянки, магнатки» «Купчихи, дворянки, магнатки»

Женщины-предпринимательницы XIX века: хозяйка заводов и приисков. Фрагмент книги

N+1
Открыть в приложении