Чтобы получить картинку, больше не нужно уметь рисовать

ТехИнсайдерHi-Tech

В начале было слово

Текст: Сергей Цыпцын

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E 2. Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Боевые машины Боевые машины

Тяжелые боевые машины, которые участвуют в соревнованиях по всему миру

Популярная механика
«Медицина стала точной наукой» «Медицина стала точной наукой»

Революция в изучении человека и новые методы терапии рака: мнение профессора РАН

Монокль
Линейная служба Линейная служба

Ижевские беспилотники Supercam не игрушки для миллениалов, а серьезные машины

ТехИнсайдер
Пластик, металл, стекло: какая посуда подходит для микроволновки Пластик, металл, стекло: какая посуда подходит для микроволновки

Какая посуда безопасна для микроволновки, а от какой лучше отказаться?

CHIP
Испытание делом Испытание делом

Экзоскелеты появляются в новостях нечасто и кажутся вещью из будущего

ТехИнсайдер
Чем минивэн отличается от микроавтобуса: простой вопрос, неочевидный ответ Чем минивэн отличается от микроавтобуса: простой вопрос, неочевидный ответ

Минивэн и микроавтобус: есть ли разница?

ТехИнсайдер
Полетим Полетим

Уже в 2030-х можно будет добраться за город на летающем такси

ТехИнсайдер
Добро пожаловать на борт! Добро пожаловать на борт!

О чем нужно помнить, собираясь в аэропорт

Лиза
Наука побеждать Наука побеждать

Краткое введение в историю и биомеханику смешанных единоборств

Популярная механика
«Кто придумал землю? Путеводитель по геофилософии от Делёза и Деррида до Агамбена и Латура» «Кто придумал землю? Путеводитель по геофилософии от Делёза и Деррида до Агамбена и Латура»

Правильно ли противопоставлять природу и культуру

N+1
Тритий пошел Тритий пошел

Изотоп водорода может подарить нам батарейки, работающие годы без подзарядки

ТехИнсайдер
Связь с народом: зачем медицинским чиновникам блоги в соцсетях Связь с народом: зачем медицинским чиновникам блоги в соцсетях

Насколько эффективно органы власти используют цифровую открытость?

Forbes
Шестой и чувства Шестой и чувства

Что есть «Москвич 6»

Автопилот
5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов 5 сверхспособностей, которые станут доступны людям уже через 5 лет по версии футурологов

Какие «суперспособности» станут реальностью уже к 2030 году — и какой ценой?

Maxim
Плутон. В долине гранатовых «льдов» Плутон. В долине гранатовых «льдов»

Что могли бы увидеть земляне, оказавшись посреди гладких льдов Плутона?

Наука и жизнь
«Искренний урбанизм»: от картинок к поиску смыслов «Искренний урбанизм»: от картинок к поиску смыслов

«Искренний урбанизм» — городская экосистема, построенная на многообразии

Ведомости
Штурманы подземелья Штурманы подземелья

Маркшейдеры — специалисты, знающие, как проложить дорогу под землей

ТехИнсайдер
Свой парень: Харрисон Форд, единый во многих лицах Свой парень: Харрисон Форд, единый во многих лицах

Герои, на которых хочется быть похожим: вспоминаем главные роли Харрисона Форда

Правила жизни
Небесный дворец Небесный дворец

Чем занимаются китайские космонавты на своей орбитальной станции?

ТехИнсайдер
Что открыть в нежилом помещении: топ-5 бизнес-идей Что открыть в нежилом помещении: топ-5 бизнес-идей

Под какой бизнес можно сдать нежилое помещение, чтобы получать прибыль?

Inc.
Буль-буль Буль-буль

Фантастический рассказ Владислава Кулигина «Буль-буль»

Знание – сила
Маленькие шаги к переменам Маленькие шаги к переменам

Интервью с создателем инклюзивных раскрасок и игрушек Натальей Пониной

Лиза
Культура всегда со страной Культура всегда со страной

Разговор с директором Эрмитажа о роли, которую играют сейчас музеи

Знание – сила
Что такое калланетика и помогает ли она похудеть: 9 упражнений Что такое калланетика и помогает ли она похудеть: 9 упражнений

Эффективный комплекс упражнений для укрепления мышц, которые можно делать дома

РБК
Просто красота Просто красота

Дизайнер Кристиан Гранде — о творческом пути в яхтенном дизайне

Y Magazine
Легенды со стрелками: 7 знаменитых часов в мире Легенды со стрелками: 7 знаменитых часов в мире

О десяти самых знаменитых часах, расположенных в разных частях нашего мира

ТехИнсайдер
Почему Тихий океан так называется, если воды его не такие уж и спокойные? Почему Тихий океан так называется, если воды его не такие уж и спокойные?

Почему самый большой океан на планете имеет такое «безобидное» название?

ТехИнсайдер
От золота к бриллиантам От золота к бриллиантам

Суперъяхта Diamond Binta — первая яхта, построенная на платформе T580

Y Magazine
Вершины олимпиадников Вершины олимпиадников

Почему растет число абитуриентов, поступающих в упрощенном порядке

Ведомости
Посвящено Беатриче Посвящено Беатриче

Данте обнаружил, осознал, как мало он знает

Наука и жизнь
Открыть в приложении