Революция нейросетей произошла практически мгновенно, и на то есть причины

ТехИнсайдерHi-Tech

В начале было слово: как нейросети научились создавать искусство из букв и предложений

Сергей Цыпцын

7cf1d0ffb239bea875f94e42e2c9eb1f_ce_1024x681x0x171.png

Буквально за один месяц графические нейросети из развлечения для гиков превратились в рабочий инструмент для иллюстраторов. Изменился и главный принцип создания изображений: теперь не важно, умеете ли вы владеть кистью или стилусом, – гораздо важнее жонглирование словами. Революция произошла практически мгновенно, и на то есть несколько причин.

Первой нейронной сетью, способной генерировать высококачественные картинки на основе текстовых описаний на английском языке, была DALL-E от компании OpenAI (один из основателей – Илон Маск). Разработчики представили ее 5 января 2021 года, но тогда программа не была доступна практически никому. Вторая версия, появившаяся в апреле этого года, DALL-E 2, уже умела создавать фотореалистичные изображения, одно из которых было размещено на обложке Cosmopolitan. Однако на работу с нейросетью было наложено множество ограничений: полученные картинки нельзя было использовать в коммерческих целях, запрещалось генерировать лица людей и т.п. И так бы все и продолжалось, если бы не конкуренты.

Легенда

Главным конкурентом оказался легендарный Дэвид Хольц, написавший докторскую диссертацию по гидромеханике в NASA и Max Planck Society. Сначала он основал Leap Motion – компанию, разрабатывающую революционные 3D-контроллеры для интерфейса при помощи жестов, а через 12 лет – Midjourney, в которой работает меньше 10 человек. Во время тестирования прототипа нейросети Midjourney в сентябре прошлого года Хольц обнаружил интересную особенность: большинство людей не знают, чего они хотят. ИИ спрашивает: «Что ты хочешь?» – и получает ответ: «Собаку». «Какую собаку?» – «Розовую». Потом пользователь видит на картинке розовую собаку – и ему достаточно.

c0cf3dc31c2991b243e7c7acc2365b3c.jpg
PROMPT: «Блондинка с короткой стрижкой, получеловек-полуандроид, обложка для научно-популярного журнала». Художник: Midjourney. DALL-E 2; Midjourney

Но если людей собрать в группу, то кто-то обязательно добавит что-нибудь вроде: «Хочу космическую собаку», а другой дополнит: «Космического пса ацтеков». Это уже игра воображения: людям действительно нравится создавать вместе. В итоге Хольц решил сделать приложение Midjourney социальным: для входа вы должны зарегистрироваться в Discord – системе мгновенного обмена сообщениями, изначально облюбованной киберспортсменами. Сейчас на Discord у Midjourney гигантское сообщество – миллион человек, которые совместно придумывают новые изображения. «Каждый раз, когда вы просите ИИ нарисовать иллюстрацию, Midjourney не помнит ничего из того, что он делал раньше, – говорит Дэвид Хольц. – У него нет воли, нет целей, нет намерения, нет способности рассказывать истории. Воля, намерения и истории – это мы. Нейросеть просто двигатель для воображения. Двигателю некуда идти, но людям есть. Это что-то вроде коллективного разума людей, оснащенного современными технологиями».

bc48157d139e460eb607f3cfeea91129.png
Нейросеть DALL-E 2 может как генерировать изображения по текстовому описанию, так и дорисовывать существующие классические картины. Здесь ИИ не только достроил одежду девушки, но и нарисовал целую комнату с обстановкой. И почти каждый день выявляются все новые и новые таланты графических нейросетей. Слева: «Девушка с жемчужной сережкой», Ян Вермеер. Справа: «Девушка с жемчужной сережкой», DALL-E.  2DALL-E 2; Midjourney

Сходящиеся картинки

Человеческий мозг устроен очень интересно: с одной стороны, он подсознательно ищет на любой картинке что-то знакомое как символ безопасности, а с другой – его бодрит новизна. Мозг всегда ориентируется на два этих принципа. Когда показываешь человеку так называемые расходящиеся модели – изображения, на которых мозг не может найти привычных смыслов, – ему становится некомфортно. Художники используют этот метод интуитивно, десятилетиями к нему подбираются. А в нейросетях «сходимость/ расходимость» можно менять вручную. Правильная балансировка нейросетей – целое искусство: перекрутишь – картинка станет неинтересной, недокрутишь – мозги закипят.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Жизнь на грани полной катастрофы Жизнь на грани полной катастрофы

Как преодолеть физическую и эмоциональную боль?

kiozk originals
Что делать, если компьютер не включается? Пошаговая инструкция по диагностике Что делать, если компьютер не включается? Пошаговая инструкция по диагностике

Сбои при включении компьютера могут происходить на разных стадиях

CHIP
«Вселенная Боба» Денниса Тейлора: жизнеутверждающая и ироничная фантастика для гиков «Вселенная Боба» Денниса Тейлора: жизнеутверждающая и ироничная фантастика для гиков

Почему «Вселенная Боба» обрела такую популярность среди читателей?

ТехИнсайдер
В черной-черной Русалочке: почему мы так реагируем на смену расы персонажа В черной-черной Русалочке: почему мы так реагируем на смену расы персонажа

Откуда столько ненависти к черной Русалочке?

VOICE
Избиение, оргии, выбитые зубы: самые странные традиции первой брачной ночи в разных странах и на Руси Избиение, оргии, выбитые зубы: самые странные традиции первой брачной ночи в разных странах и на Руси

Рейтинг самых странных ритуалов на первую брачную ночь

ТехИнсайдер
Зачем Петр I издал эти указы? 5 самых странных и необычных реформ российского императора Зачем Петр I издал эти указы? 5 самых странных и необычных реформ российского императора

Зачем Петр I реформировал алфавит и летоисчисление?

ТехИнсайдер
Ход конем Ход конем

Приручение лошади стало первым и важнейшим прорывом в истории человечества

Вокруг света
Правда ли, что инки могли размягчать камни? Тайна Мачу Пикчу разгадана Правда ли, что инки могли размягчать камни? Тайна Мачу Пикчу разгадана

Геологи нашли ответ на одну из древнейших архитектурных загадок

Maxim
Почему в древности люди пили вино вместо воды и как выглядит самый древний погреб в мире: 10 удивительных фактов о вине Почему в древности люди пили вино вместо воды и как выглядит самый древний погреб в мире: 10 удивительных фактов о вине

Репутация вина укреплялась столетиями, но многого вы о нем не знали

ТехИнсайдер
Ученые доказали, что квантовая запутанность работает на расстоянии нескольких метров Ученые доказали, что квантовая запутанность работает на расстоянии нескольких метров

Даже самые передовые «атомные» часы теряют счет, когда их доводят до предела

ТехИнсайдер
Прочие опасности Прочие опасности

Что писали в «дорожных» книгах 1950-х и 1960-х годов

Автопилот
Апноэ во сне связали с риском рака, тромбоэмболии и когнитивных нарушений Апноэ во сне связали с риском рака, тромбоэмболии и когнитивных нарушений

Наибольшее влияние оказывает вызываемая заболеванием апноэ гипоксия

N+1
Красота Красота

Самые богатые и утончённые ароматы, которые радовали нас в этом году

Robb Report
«Сын-подросток постоянно спит и мало ест»: стоит ли пытаться изменить образ жизни ребенка? «Сын-подросток постоянно спит и мало ест»: стоит ли пытаться изменить образ жизни ребенка?

Как наладить доверительные отношения с подростком?

Psychologies
Автомобили Автомобили

Отрадно, что все сюрпризы в автомобилестроении исключительно приятные

Robb Report
«Играй хорошо»: краткая история бренда Lego «Играй хорошо»: краткая история бренда Lego

«Сноб» вспоминает историю датского бренда Lego

СНОБ
Наплели моду Наплели моду

Что не так с поисками майорановских фермионов и при чем тут Microsoft

N+1
Как спорт прокачивает мозг: физическая нагрузка для тренировки ума и памяти Как спорт прокачивает мозг: физическая нагрузка для тренировки ума и памяти

Что происходит с нашим мозгом, когда мы занимаемся спортом?

ТехИнсайдер
Волшебный шкаф Волшебный шкаф

Беречь вещи, продлевать им жизнь, реже покупать новые – разумный подход

VOICE
Как иностранцы называют Москву? Вы удивитесь! Как иностранцы называют Москву? Вы удивитесь!

Многовековая Москва обрела немало прозвищ за свою историю

ТехИнсайдер
С возвратом. Как получить налоговый вычет по ипотеке С возвратом. Как получить налоговый вычет по ипотеке

Все граждане России имеют право на получение налогового вычета при покупке жилья

Лиза
«Быть, принадлежать, становиться»: как воспитывают детей в Австралии «Быть, принадлежать, становиться»: как воспитывают детей в Австралии

В чем главная ценность страны, занимающей целый континент?

Вокруг света
Что говорит о тебе твоя лучшая подруга Что говорит о тебе твоя лучшая подруга

Кого и почему ты выбираешь в друзья?

VOICE
Решающую роль в вымирании динозавров могли сыграть вулканы. Астероид только усилил их действие Решающую роль в вымирании динозавров могли сыграть вулканы. Астероид только усилил их действие

Что же погубило динозавров?

ТехИнсайдер
Архитектор Александр Козлов — об облике Москвы, модном и вечном интерьере Архитектор Александр Козлов — об облике Москвы, модном и вечном интерьере

Интервью с Александром Козловом, представителем интерьерной архитектуры

РБК
Пора отделить коноплю от марихуаны Пора отделить коноплю от марихуаны

Компания Smart Hemp наладила полный цикл производства продукции из конопли

Эксперт
Авиация Авиация

Смена поколений в бизнес-авиации идёт полным ходом

Robb Report
5 правил эффективного совещания от Рэя Далио 5 правил эффективного совещания от Рэя Далио

Правила для рабочих встреч, которые помогают проводить без лишней траты времени

Inc.
Панки, шпионы и Уорхол: кто сделал Елизавету II поп-иконой Панки, шпионы и Уорхол: кто сделал Елизавету II поп-иконой

Кто сопровождал Елизавету II на пути к статусу поп-культурной иконы

Правила жизни
Неравенство и супераппы: как устроен финтех-рынок Узбекистана и чего там не хватает Неравенство и супераппы: как устроен финтех-рынок Узбекистана и чего там не хватает

Какие ниши в Узбекистане свободны и за какими финтех-сервисами будущее?

Forbes
Открыть в приложении