Тому, кто умеет видеть, абсолютно ясно, что произведение искусства – это зеркало, в котором отражается душа художника.
Поль Гоген
От автора
Если честно, у меня язык не поворачивается назвать эту книгу учебником или сборником методических рекомендаций, хотя здесь есть все, что характерно для учебных пособий: структура построения и логика изложения материала, подробные объяснения и инструкции, вовлечение читателя в интерактивную деятельность и т.п. Скорее, это попытка в неформальном ключе поделиться с собеседником собственным опытом «общения» с нейросетью, а также показать тем, кто не умеет рисовать «от слова совсем», способы создания удивительных изображений, которые подчас поражают своим качеством и художественным уровнем.
Сегодня существует много зарубежных и отечественных платформ для рисования с помощью искусственного интеллекта, разработанных для смартфонов и ПК. Наиболее популярные нейросети – Midjourney, Stable Diffusion, DALL-E, GenZArt, Insomnia AI, Stability AI, Dezgo, Vivid AI. Эти и другие «рисовалки» (включая бесплатное приложение Dreamerland, в котором я вам предлагаю заняться творчеством), отличаются друг от друга уровнем сложности, каждая имеет набор своих, только ей присущих функций; некоторые существуют просто для развлечения, а в каких-то можно создавать иллюстрации, готовые обложки для книг или музыкальных альбомов, логотипы и т.д., то есть их применяют с конкретной практической целью. Объединяет же все нейросети одно качество: изображения в них генерируются с помощью слов.
Это кажется невероятным, но процесс «рисования» протекает именно так: ты вводишь в специальном окне набор слов или словосочетаний, которыми описываешь то, что хочешь видеть в своей картинке, из предложенного списка выбираешь стиль, нажимаешь на кнопку Старт – и через минуту получаешь результат. Для тех, кто, подобно мне, никогда в жизни не держал в руке карандаш и в школе на уроках по изо приходил в ужас при виде акварельных красок, это просто фантастический шанс стать настоящим художником!
Я, что называется, с головой погрузился в создание изображений. Сначала был в восторге от каждого рисунка, более или менее правдоподобного «снимка», но потом мой энтузиазм понемногу начал улетучиваться: почему-то все картины получались однообразными, скучными или манерой сильно уж напоминали работы известных живописцев, чьи имена находились в готовом списке стилей и направлений. Я даже было подумал, что все, наигрался с «рисовалкой», но тут мне в голову неожиданно пришла мысль: а почему бы не попробовать написать запрос не отдельными словами, а в виде предложений? – ведь если нейросеть способна думать как человек, то, возможно, она как-то иначе, глубже сможет воспринять связный текст и создать изображение на более высоком уровне!
Уже первые картинки, сгенерированные на текстовой основе, показали, что эта идея оказалась верной: искусственный интеллект чутко реагировал на мои подробные описания и выдавал все более интересные работы. Некоторые из них буквально приводили меня в восторг, потому что результат превосходил все мои ожидания. Чем дольше я «сотрудничал» с нейросетью, тем больше понимал, что у нее поистине неисчерпаемый творческий потенциал и все зависит лишь от того, насколько убедительно и красноречиво ты составишь «рассказ о будущей картине» – а уж электронный художник сделает все, чтобы ты остался доволен.
Поначалу мои тексты были довольно хаотичны, но постепенно я их стал упорядочивать, структурировать, пока наконец они не приобрели ту форму, в какой я их представляю в этой книге. Разумеется, параллельно с разработкой своего метода написания промптов («подсказок») для генерации изображений я изучал и традиционные способы, предлагаемые в сети, и включал наиболее эффективные «фишки» в работу – зачем изобретать велосипед, если он уже существует, можно ведь просто им воспользоваться, правда?
Моим же собственным «велосипедом» стал прием оживления картинки с помощью словесного описания мыслей, ощущений, впечатлений, которые стремится выразить в работе художник, нюансов атмосферы и настроения, заложенных в картине, и даже «проговаривания» того эффекта, который изображение произведет на зрителя. Самое удивительное, что нейросеть, сама не способная чувствовать и испытывать эмоции, чутко реагирует на подобные инструкции в на самом деле творит чудеса, «оживляя» картинку в соответствии с запросами автора, наполняя ее энергией вашей мысли и вашего уникального видения этого мира. А ведь картина, заряженная живой энергией, уже принадлежит к сфере искусства – ни больше и ни меньше…
Друзья, если мои слова что-то затронули у вас в душе, если сердце вдруг отозвалось радостным предвкушением творчества, тогда эта книга – для вас: я приглашаю совершить со мной увлекательное путешествие в мир изобразительного искусства – путешествие, после которого вы никогда не останетесь прежними…
Роман Романов
Часть 1. Создание фотоизображений
Глава 1. «Рисуем» наш первый нейрошедевр!
Ну что, начнем? Если вы уже скачали приложение Dreamerland, то давайте поскорее его откроем. Попав на главную страницу, которая в нижнем левом углу экрана обозначена символом с изображением домика, мы на пару минут здесь и задержимся: нам необходимо набрать немного баллов (credits), чтобы потом уже спокойно заняться творчеством.
В правом верхнем углу вы, скорее всего, обнаружите, что у вас уже есть 10 баллов, красиво представленных на желтом фоне, однако их явно недостаточно для полноценного рисования, поэтому давайте сразу заработаем еще несколько. Каким образом? Нажимаем на эту самую желтую кнопку с количеством баллов, и нас переносит на страницу «зарабатывания».
В центре страницы ваше внимание наверняка сразу же привлекут три желтых окна, где вам предложат купить баллы для творчества за настоящие деньги, но мы их просто проигнорируем и перенесем взгляд на куда более неприметный темный экран вверху. На нем написано по-английски белым шрифтом: «Посмотрите рекламу, чтобы заработать 5 баллов». А ниже маленькими желтыми буквами приписано: «Потребуйте сейчас» (claim now).
Мы и потребуем: нажмем на эту кнопку и просмотрим рекламный ролик (ну или просто подождем, пока он кончится). Убедившись, что счет у нас пополнился на пять обещанных баллов, мы еще пару раз проделаем эту операцию – и на первый рисунок нам точно хватит средств! А потом будем пополнять баланс по мере необходимости.
Теперь наконец можно приступить к творческому процессу. На главной странице в нижнем ряду значков нажмем на изображение кисти (третий слева) и попадем на страницу создания и редактирования картинок – это и будет наша художественная мастерская!
Для начала мы выберем модель для создания реалистических фотографий (потому что первая часть книги посвящена именно этому виду искусства). Под словом Model в верхнем левом углу страницы редактирования ткнем пальцем в прямоугольник, обведенный оранжевым цветом. Перед нами выпадет целое меню моделей – настроек искусственного интеллекта (ИИ), которые определяют стиль и элементы изображения. Выберем бесплатную модель Dreamer Photoreal или Dreamer Photoreal V2 (лично мне вторая версия кажется более удачной), и в ленте появившихся вариантов (fine-tuning) выберем тип изображения, который вас больше устраивает зрительно. Я выбираю опцию Balanced, а вы – на свое усмотрение.
Ниже всех этих вариантов мы увидим пустое окно, над которым написано слово Prompt («промпт», то есть подсказка). Внимание: это самое важное поле в нашем творческом процессе, ибо именно здесь мы будем при помощи текста создавать будущий снимок, а ИИ его сгенерирует согласно нашим описаниям.
Этот режим создания изображений называется Text to i («от текста к картинке»), он выставлен у вас по умолчанию. Если мы прокрутим вниз три узенькие белые строчки, то увидим слово Mode («режим»), а под ним в первом треугольнике слева как раз и прочтем слова Text to i – это подтверждает, что мы с вами на верном пути.
Плохая новость: наш новый друг – нейросеть Dreamerland – понимает только по-английски, поэтому для облегчения участи тех, кто не владеет родным языком Гарри Поттера, Бритни Спирс и Эминема, в книге я буду переводить промпты на английский. Вы же можете смело сочинять свои описания по-русски, переводить их с помощью любого онлайн-переводчика и вставлять в окно Promt.
Итак, кого бы вы хотели «сфотографировать» для начала? Наверное, котика? Ну конечно, кто бы сомневался: почему-то все начинающие прежде всего хотят изобразить именно котика. И никто, никто не додумается нарисовать, скажем, енота! Мне это кажется возмутительной дискриминацией такого замечательного животного, поэтому сейчас я настойчиво предлагаю создать фотографию домашнего енота, и если раньше вы имели против этого зверька какие-то предубеждения, то, уверяю, после нашего урока вы полюбите его так же, как и я. Впрочем, хватит болтовни, пора действовать! В поле Prompt пишем:
«Реалистичное фото забавного домашнего енота, поедающего красный виноград».
A realistic photo of a funny home raccoon eating red grapes.
Чуть ниже ткнем пальцем в поле Styles, чтобы выбрать стиль, в котором будет выполнено наше изображение. Из нескольких синих слов на появившейся странице выберем Photography – выпадет меню эффектов (Effects) и фотоаппаратов (Camera). В первом выбираем Realistic и до кучи Photorealistic, а из списка камер остановимся, допустим, на CannonEOS 5DMarkIV. Сделали? Отлично, идем дальше – точнее, возвращаемся на страницу редактирования.
Пропустим пока окно Negative Prompt и ткнем пальцем в поле Aspect Ratio (в вольном переводе – «формат изображения»). Здесь нас пока будут интересовать три формата, имеющиеся в бесплатном доступе – вертикальный Portrait («портрет» – 2:3), горизонтальный Landscape («пейзаж» – 3:2) и квадратный – 1:1. Квадрат, пожалуй, сейчас и выберем – чисто из любопытства.
Все последующие настройки оставляем как есть и в самом низу страницы наконец-то нажимаем на желтую кнопку Start drawing («Начинаем рисовать»). Согласно крошечным словам на этой же кнопке, за данную услугу с нас спишут один балл (1 credit will be used). Подумаешь, напугали – у нас их уже два десятка, а будет еще больше!
Все, ждем, пока уважаемый ИИ сгенерирует нам фотографию лучшего в мире домашнего енота! В это время нам могут показывать рекламу, и весь процесс займет от нескольких секунд до нескольких минут – все зависит от возможностей вашего смартфона.
А вот и фотография нашего енотика – ну ведь как живой, да? Вообще Dreamerland предлагает сразу два варианта изображений, но я выбрал вот этот: здесь наш питомец получился чуть более реалистично.
Рис. 1. Крошка енот
Немного повосторгавшись снимком, давайте все же вглядимся в него повнимательнее. Вас ничто не смущает? Вроде бы все нормально, только вот желтый язык выдает неопытность «художника» – в самом деле, откуда нейросети знать, что у енотов вовсе не желтый язык, если все поголовно заказывают котиков! В общем, друзья, придется исправлять ситуацию, раз уж мы претендуем на звание фотографов-реалистов.
На главной странице внизу нажимаем на четвертый слева значок, там изображена голова и плечи человечка – это ваша личная страница, где вы можете заполнить профиль по своему вкусу и где отныне будет храниться вся история (History) ваших произведений. Выбираем единственный сохранившийся там снимок, внизу страницы нажимаем на желтенькую кнопку с надписью Evolve («улучшить фото путем естественной эволюции» ) – и снова попадаем на страницу редакции снимков. Единственное, нас автоматически перевели в режим ImagetoImage («от картинки к картинке»), и теперь посреди страницы красуется уменьшенное изображение нашего милахи енота.
Из всех вариантов модели Dreamer Photoreal V2 мы вновь выбираем опцию Balanced, а потом идем к белому полю с названием Negative Prompt. Здесь мы высказываем нейрохудожнику наше фи и пишем то, чего не хотим видеть у себя на снимке! Прежде всего это, конечно же, желтый язык (yellow tongue), ну и мне еще фон показался несколько темноватым, поэтому я добавляю такую претензию: «слишком темный фон» (too dark background). Эти два словосочетания мы просто пишем через запятую: ИИ отлично нас поймет.
Все, пока добавить вроде бы нечего, поэтому просто нажимаем на кнопку рисования (Start drawing), используя еще один балл из запасов, и нервно грызем ногти в ожидании результатов нашего творческого вмешательства.
Готово! Что там у нас получилось? Ну вот, желтый язык исчез, да и свету прибавилось, фото сразу стало живее, правда же?
Рис. 2. Крошка енот
В принципе, на этом уже можно было бы остановиться, но ведь нет предела совершенству, хочется так преобразить реальность, чтоб все ахнули! Ну, давайте продолжим. Почему бы нам не перенести нашего любителя винограда на улицу, в сад, чтоб вокруг была зелень и голубело небо? Сделаем? Да раз плюнуть…
Выбираем в личном кабинете наше улучшенное фото и снова подвергаем его «естественной эволюции» (желтая кнопка Evolve внизу). В поле Prompt добавляем такой текст:
«На фоне сад с зелеными деревьями и деревянным домом. Видно ясное голубое небо.»
A garden with green trees and a wooden house in the background. The clear blue sky is seen above.
Из поля с негативными подсказками можно убрать слова о темном фоне, а про желтый язык пусть «художник» пока помнит, чтоб снова не нарисовал – кто знает, какая причудливая идея может прийти в голову нейросети.
Все, нажимаем на Start Drawing и ждем чудесных результатов!..
Так, и что мы получили? А получили мы неяркую зелень за окном, кусочек деревянного дома и чудесные виноградные «ножки» – это «художник» уже сам постарался, добавил в снимок реалистическую деталь. Неба же мы не видим, и это довольно логично при такой композиции кадра. Ну, давайте так и оставим, потому что деревья все равно создали нам очень уютную атмосферу.
Рис. 3. Крошка енот
Что ж, на этом можно было бы и остановится, потому что для первого раза мы и так добились сногсшибательных результатов – а что, у нас получился именно енот, а не какой-нибудь сурикат, и вполне себе естественного окраса, а не сиреневый или фиолетовый. Однако давайте все же попытаемся довести снимок до совершенства – ну а если не получится, оставим пока как есть.
Текст в поле Prompt отредактируем следующим образом:
«Реалистичное фото забавного домашнего енота, поедающего красный виноград. Предельно реалистичный мех, живое выражение мордочки и глаз. На фоне сад с зелеными деревьями и деревянным домом. High res, -testp, -upbeta -upbeta -upbeta».
A realistic photo of a funny home raccoon eating red grapes. Highly realistic fur, the animal has a livily expression in its face and eyes. A garden with green trees and a wooden house in the background. High res, -testp, -upbeta -upbeta -upbeta.
Пожалуйста, не приходите в ужас от той абракадабры, которую я выделил в тексте жирным шрифтом. Сейчас объясню, что все это значит: "High res, -testp, -upbeta -upbeta -upbeta" – не более чем набор технических инструкций для нейросети, создающей изображения на основе текста.
High res (сокр. от high resolution – «высокое разрешение») означает, что мы хотим создать картинку особо высокого разрешения.
Инструкция -testp (test prompt) дает ИИ указание сделать изображение как можно более правдивым и реалистичным. Хотя нет никакой необходимости использовать именно этот термин, чтобы достичь желаемого результата, и вы можем получить такой же эффект, просто указав в тексте, что хотите жизнеподобное фото или реалистичное изображение, однако употребление точной терминологии сделает ваш промпт более профессиональным. К тому же, встретив его в интернете, вы сразу поймете, о чем идет речь.
Что же касается «мантры» -upbeta -upbeta -upbeta, то она является как бы усилителем промпта, выступая в качестве маркера, который дает нейросети указание использовать более совершенные алгоритмы для генерации картинок. В результате фото получается более реалистичным и жизнеподобным.
Говоря проще, если мы добавляем в рецепт ингедиент -upbeta, то имеем на выходе более драматичное и фотореалистичное изображение. А «мантра» -upbeta -upbeta -upbeta просто усиливает эффект и делает смысл термина более мощным.
Я, наверное, до смерти утомил вас технической белибердой, так что просто впишите все это в текст промпта, и пусть ИИ выполняет свою работу – создает нам финальное изображение домашнего пушистика.
Рис. 4. Крошка енот
Ну что, друзья, результат вас впечатлил? Честно говоря, я бы не сказал, что енот, скалящий зубы, вызывает у меня бурный восторг, но шкурка у него и впрямь стала более натуральная, а в глазах появился живой лукавый огонек – наш питомец приобрел характер, а это, согласитесь, очень важно! Да и качество снимка – обратите внимание! – улучшилось благодаря нашим «шаманским заклинаниям». Так что впредь не ленитесь их использовать в своих промптах.
На этом пока можно остановится, как вы считаете? В личном кабинете у вас наверняка остались все фотографии, и, если вам не терпится поделиться с людьми результатами своего творчества, вы можете опубликовать их прямо здесь, на платформе Dreamerland. Для этого вам нужно нажать кнопку Public, расположенную слева от кнопки History, и выбрать наиболее удачное изображение.
А я с вами пока прощаюсь – до встречи в следующей главе!
Глава 2. Натюрморт
Сегодня мы сделаем реалистичный снимок в эстетском жанре натюрморта.
Натюрморт – это вид изобразительного искусства, представляющий неодушевленные предметы, обычно довольно мелкие (фрукты, цветы, овощи, бутылки, миски, тарелки, столовые приборы), расположенные в определенной композиции, иногда с фоном. В фотографии натюрморт зачастую реалистичен и детализирован, а объекты показаны в статичном и спокойном окружении, как бы застывшем во времени. Композиция для натюрморта обычно создается самим художником / фотографом в условиях мастерской или дома. Цель натюрмортов – запечатлеть сущность и красоту предметов через форму, цвет, текстуру и свет.
Мы с вами будем создавать эту красоту в несколько этапов: сначала придумаем композицию, потом обговорим основные настройки в фотоаппарате, а в конце попытаемся наполнить снимок жизнью – и все это исключительно с помощью слов! Ну что, поехали?
Как и в прошлый раз, на странице редактирования изображений в разделе Model мы выберем модель для создания реалистичных снимков – Dreamer Photoreal V2, а в списке появившихся вариантов (fine-tuning) – тип изображения, который вам больше всего понравится. Я по-прежнему останавливаюсь на опции Balanced.
В поле формата изображения (Aspect ratio) на этот раз облюбуем размер 2:3 – я задумал нарисовать цветы в высокой вазе, а для этого больше всего подойдет снимок, ориентированный вертикально.
Как вы помните, сначала мы будем работать в режиме «от текста к картинке», поэтому в разделе Mode выбираем вкладку Text to Image.
А теперь – внимание: сегодня на странице редактирования изображений мы воспользуемся еще несколькими функциями, о которых я ранее не упоминал. Обратите внимание на последние пять строк – под ними находится только кнопка Start Drawing.
Сейчас мы рассмотрим два поля – Sampling Steps и Sampling method. В первом вы указываете нейросети, какое количество шагов задаете для генерации изображения. Чем больше шагов назначаете, тем детальнее и реалистичнее получается снимок. По умолчанию установлено 25 шагов, максимально же предусмотренное количество – 40. Логично предположить, что чем большее число вы выставляете, тем дольше приходится ждать результата, но лично мне еще ни разу не приходилось ждать изображения больше двух-трех минут, хотя я всегда выставляю максимальное число шагов, поэтому смело можете делать то же самое.
Что касается поля Sampling method («метод генерации»), то для создания реалистичных снимков мы пока ограничимся методом, установленным по умолчанию – Euler A, или переключимся на Euler, большой разницы не будет.
Ну все, технические настройки мы с вами осуществили, и теперь можем приступить непосредственно к творческой части. Для начала в деталях опишем предметы натюрморта, которые хотим видеть у себя на фотографии, и укажем, как они расположены в пространстве снимка. Всю эту информацию мы, разумеется, занесем в поле Prompt.
Шаг 1
«Реалистичная фотография осеннего натюрморта с несколькими желтыми хризантемами в синей керамической вазе. Рядом с вазой на столе лежат два яблока. На заднем плане мы видим часть бледно-голубой стены с шероховатой текстурой и несколько веток с мелкими сухими цветами желтого цвета. Фотография спокойная, простая и эстетически привлекательная, с акцентом на цветах в вазе. Композиция хорошо сбалансирована, с сочетанием мягких, неярких цветов».
A realistic photo of an autumn still life with a few yellow chrysanthemums in a blue ceramic vase, set on the table with two apples. In the background, we can see a part of a pale-blue wall with rough texture and a few branches with small yellow dried flowers. The photo is peaceful, simple, and aesthetically pleasing, with the spotlight on the flowers in the vase. The composition is well-balanced, with a mix of soft colors.
Рис. 5. Натюрморт с хризантемами
Так-так, что тут у нас получилось? Цветы вышли немного «уставшими» не только на фоне, но и в вазе; вместо второго яблока на столе ИИ нарисовал… камень (!), а для баланса композиции еще и второй положил в глубине. Особого акцента на цветах в вазе я пока не замечаю, что же касается характера поверхностей, то вместо шероховатой стены наш художник сделал столешницу с грубой фактурой – короче, полный креатив!
Впрочем, натюрморт вышел довольно интересный и уж точно неизбитый, поэтому я пока не буду предъявлять нейросети претензии в поле Negative Prompt. Давайте сразу перейдем к настройкам фотоаппарата, чтобы наш снимок получился как можно более профессиональным.
А, нет, сначала покажу еще пару важных настроек в Dreamerland. Они помогут избежать нежелательных изменений в понравившемся нам рисунке и сохранить композицию и прочие элементы при его дальнейшей обработке.
Итак, у себя в личном кабинете выбираем только что созданный нами снимок – сразу под ним мы видим текст нашего промпта; тычем в него пальцем и видим всплывающее окошко с надписью Prompt copied («промпт скопирован»). В самом низу нажимаем на кнопку Evolve – и мы с вами снова на странице редактирования изображений. Если вдруг из окошка Prompt уже исчез наш текст, то мы туда вставляем только что скопированную информацию о снимке.
В меню раздела Mode мы отмечаем, что автоматически перешли в режим работы «от картинки к картинке» (ImagetoImage), и тут же видим выбранное нами уменьшенное изображение натюрморта.
Сразу под ним находится поле PromptStrength («сила промпта»). Тычем в него, и перед нами появляется шкала с бегунком; диапазон значений на шкале – от 0.1 до 1.0. Что означают эти числа? Прямо над шкалой по-английски написана «шпаргалка» о том, как работает этот алгоритм – вот ее перевод:
«Чем выше число, тем больше новых деталей будет в изображении. Чем ниже показатель, тем ближе к оригиналу выйдет картинка».
То есть если мы возьмем максимально низкий показатель – 0.1, то изображение вообще останется нетронутым и наши попытки внести хоть какие-то изменения будут равны нулю. Если же мы переметнемся на другой конец шкалы и выставим 1.0, то никогда не узнаем в новом творении свой натюрморт.
Для того чтобы оставить основное изображение как есть, но при этом внести некоторые изменения, мы осторожно подвинем бегунок на отметку 3.5 – показатели в диапазоне от 3.0 примерно до 4.0 помогают умеренно преобразовывать оригинальный рисунок.
Ну что, совершили это важное действие? Если да, тогда приступим к составлению технических подсказок для нейросети. Записывать мы их будем в поле Prompt сразу же после имеющегося там текста. И не пугайтесь терминологии из области фотографии: я объясню, что значат непонятные слова и цифры – на самом деле они совсем не так страшны, даже если вы никогда не пользовались своим фотоаппаратом в режиме ручной съемки. Для нас сейчас главное – понять, зачем эти настройки вообще нужны: ухватив суть, мы потом сможем писать текст обычными словами, добиваясь того же эффекта, какого фотографы достигают при помощи своих хитрых настроек.
Шаг 2
«Nikon D3500, обычный объектив, диафрагма f/7.1, ISO 200, выдержка 1/125 с. Фокус на деталях вазы с цветами. Средняя глубина резкости, плавное размытие создают мягкое и умиротворяющее настроение».
Nikon D3500, normal lens, aperture f/7.1, ISO 200, shutter speed 1/125 s. Focus on the details of the vase with flowers. Middle depth of field and smooth blurring create a soft and soothing mood.
Вы что, уже в обмороке от обилия терминов? Все нормально, сейчас вместе в них разберемся. Итак, начнем с объектива – вы же помните, что у фотографов их целая куча и они нещадно оттягивают плечи, если те куда-то выезжают со всем своим профессиональным скарбом? А мы с вами в гораздо более выгодном положении: нам всего-то нужно написать, какой именно объектив выбрать, чтобы добиться такого же (ну или почти такого же) результата.
Обычный объектив (или фикс-объектив) – универсальный и незаменимый инструмент для создания натюрморта, поскольку позволяет контролировать всю композицию, не искажая объекты и не нарушая перспективу. Он также дает возможность создавать более драматичные фотографии с хорошим контрастом и яркими цветами, так как не смягчает картинку и обеспечивает более четкое и детальное изображение.
Далее, нам нужно настроить три параметра – диафрагму, выдержку и светочувствительность, которые отвечают за экспозицию – количество света, который попадает на датчик камеры и отвечает за качество снимка, делая его сбалансированным, а не пересвеченным или чересчур темным. Звучит страшно, но помните, что нам лишь нужно понять основной принцип применения этих настроек, чтобы давать нейросети команды для создания нужный эффекта.
Итак, диафрагма: в фотоаппарате это отверстие, которое контролирует количество света, попадающего в объектив камеры, и измеряется в диафрагменных числах – например, f/16. Что касается создания изображений в Dreamerland, значение диафрагмы влияет на степень размытости изображения – это ключевой элемент, который позволяет нам контролировать фокус и глубину резкости снимков.
Принцип здесь такой: чем меньше числовое выражение диафрагмы (f/1.8, f/3.5, f/4.5), тем больше будут размыты предметы, находящиеся не в фокусе. И наоборот, чем выше число (f/11, f/16, f/22), тем более четким будет изображение.
Для натюрморта в среднем подходит следующий диапазон значений диафрагмы: f/3.5 – f/16. Но конкретное значение зависит от композиции, которую вы создаете, и настроения, которое хотите передать. Например, при малой глубине резкости для размытия фона будет использоваться значение f/3.5. А для более четкого изображения с большим количеством объектов в фокусе будет применяться f/16.
Далее, светочувствительность ISO – параметр, который определяет, насколько чутко сенсор камеры реагирует на свет. Зависимость такая: чем больше число ISO, тем светлее кадр. Когда света достаточно, ставьте на фотоаппарате ISO 100 или ISO 200. Если немного не хватает – держитесь в районе ISO 400 – ISO 800. В сумерках и полумраке значения ISO могут находиться в диапазоне от 1000 до 1600. В современных цифровых камерах значения и того больше: 3200, 6400 – при таких показателях можно смело делать снимки даже в непроглядной ночи.
И наконец, выдержка. Выдержкой называют время экспозиции, в течение которого затвор камеры остается открытым и на матрицу попадает свет. Большинство кадров делается на коротких выдержках – в сотые и тысячные доли секунды. Но есть снимки и с длинной выдержкой – в 20 или 30 секунд. Отдельные объекты на таких фотографиях остаются четкими, а другие красиво смазаны – например, на пейзажном снимке ночного города огни автомобилей сливаются в единый цветной поток.
Все, больше не мучаю вас никакими объяснениями – пора применять знания на практике: вводите в поле Prompt данные из Шага 2, ждите, когда ИИ сгенерирует снимок, и смотрите, как изменился наш натюрморт!
Рис. 6. Натюрморт с хризантемами
Ну, что у нас получилось на этот раз? Ага, за счет легкого размытия фоновых предметов появился объем, которого до этого не было. Хризантемы «ожили», будто напитались водой, а сухостой на заднем плане стал более приглушенного цвета и больше не отвлекает внимание от цветов в вазе. Кожица яблока теперь выглядит более натуральной, и изображение в целом стало больше походить на фотографию, нежели раньше – ай да нейросеть, ай да молодчина!
В принципе, на этом можно было бы и завершить создание нашего изображения, но раз уж жанр натюрморта принадлежит к сфере искусства, то я хочу предложить вам еще один этап работы – словесное описание атмосферы, настроения снимка и, возможно, еще чувств, которые вы бы хотели вложить в свое произведение, а также эмоциональный отклик, который ваша фотография способна вызвать в зрителях.
Ну, это уже вообще черт-те что, можете воскликнуть вы, все равно эмоции и чувства невозможно увидеть на картине, так зачем же тратить время, пытаясь выразить их словами! А вот тут вы и ошибаетесь, возражу я вам: всякое искусство рождается в двух мирах – видимом мире образов, звуков, слов, движений, и одновременно в невидимом мире души Творца. За каждым видимым образом и слышимым звуком всегда стоит бесплотная авторская идея, его настроение, жизненный опыт, и именно невидимое присутствие талантливого создателя делает его произведение живым и даже осязаемым. Подобно тому как Бертольд Брехт сказал в коротеньком стихотворении: «Театр – это не то, что вы видите на сцене, театр – это то, что происходит за кулисами», можно утверждать, что искусство – это не то, что вы видите на картине, а то, что происходило в голове и душе художника, когда он ее создавал.
Ну ладно, неохотно уступаете вы, но ведь машина-то не может оживить произведение, у нее хоть и интеллект, но все же искусственный! Машина не может, соглашусь я, но вы способны ей помочь начать «чувствовать», давая творческие задания – как-никак нейросеть создана по образу и подобию человеческого мозга и способна многому научиться. Так давайте ей подарим шанс стать настоящим художником!
Предлагаю сделать так: если вы считаете, что подобная работа – пустая трата времени, то можете остановиться на полученном результате, а если хотите поэкспериментировать, тогда сочиним еще один промпт для создания нашего натюрморта и посмотрим, что из нашей затеи вышло.
А, еще один момент: в самом конце текста не забудьте написать слово в слово абракадабру, которую я вам давал в прошлый раз – если вы помните, этот набор символов поможет улучшить качество изображения:
High res, -testp, -upbeta -upbeta -upbeta
Шаг 3
«Изображение словно подернуто едва заметной, легкой и грустной дымкой. Теплую осеннюю атмосферу создают неяркие цвета и фактуры хризантем, яблока, камня, а также мягкий, спокойный свет, заполняющий пространство и подчеркивающий очертания предметов. Натюрморт словно рассказывает о красоте и безмятежности смены времен года, которые всегда приходят и уходят в свой срок, не раньше и не позже. Картина напоминает о том, что не стоит никуда торопиться, что нужно наслаждаться простыми вещами и ценить каждый маленький момент в жизни. Изображение может вызывать чувство бесконечной благодарности и покоя».
The i is as if covered with a barely noticeable, light and sad haze. A warm autumn atmosphere is created by the soft colors and textures of chrysanthemums, apple, stone, as well as gentle, calm light that fills the space and highlights the shapes and forms of the objects. The still life seems to tell about the beauty and serenity of the changing seasons that always come and go at their proper time, not earlier and not later. The picture reminds us to take our time, slow down and enjoy the simple things in life, as well as appreciate every little moment of it. The i may evoke feelings of eternal gratitude and peace.
Рис. 7. Натюрморт с хризантемами
Знаете, ребята, лично я доволен последним штрихом. По картине словно прошлись кистью времени: камень – символ вечности – зрительно состарился, «запыленные» ветки мимозы еще больше отодвинулись в далекое, непроглядное прошлое, «пожилые» хризантемы ведут тихое, неназойливое существование в старомодной вазе, а вот яблоко, наоборот, как бы выдвинулось на передний план – наверное, оно символизирует те самые маленькие радости сегодняшнего дня, о которых всегда следует помнить.
Видите, последний кусок текста ничего не прибавил и не убавил в плане композиции, но чуть изменилась атмосфера – и натюрморт сразу «оброс» новыми смыслами. Так работает искусство, друзья…
***
Если вы вдруг захотите еще раз воспользоваться этим же самым промптом, но при этом создать новое изображение, не связанное с предыдущим, то в личном кабинете выберите получившийся натюрморт, но вместо кнопки Evolve внизу страницы нажмите на Clone («клонировать») слева от нее. Вас тут же перенаправят на страницу редактирования снимков, и почти в самом низу вы увидите поле Seed, где появилось некое многозначное число. Это автоматически сгенерированное число нашего изображения. Мы ничего не будем с ним делать, а поднимемся вверх, где в окне Prompt снова оказался текст для нашего осеннего натюрморта. Теперь в поле Mode выберите режим TexttoImage и нажмите на кнопку Start Drawing. Процесс клонирования запущен!
Рис. 8. Осенний натюрморт
У меня неожиданно получился вот такой яркий снимок – а что, осень ведь бывает разная: грустная и праздничная, блеклая и полная насыщенных красок. После философского изображения в приглушенных тонах нейросеть решила нас порадовать солнечным снимком с сентябрьским разноцветьем. Как видите, с композицией ИИ не сильно заморачивался, лишь по-новому преподнес отдельные предметы, но зато радикально изменил характер и настроение фотографии – что ж, спасибо ему за такое дивное разнообразие.
Глава 3. Пейзажный снимок
Сегодня мы с вами попытаемся создать зимний горный пейзаж с вулканом на заднем плане.
Пейзаж – один из самых распространенных и популярных эстетских жанров изобразительного искусства. Здесь объектом изображения являются природные ландшафты, подчеркивающие красоту, величие и разнообразие окружающей среды, ее текстур, элементов и т.д. Пейзажи можно писать, рисовать или фотографировать, цель же изображения природных красот состоит в том, чтобы запечатлеть основные элементы, краски, формы и характер местности, а также передать ощущение присутствия в этом месте.
Помните, в прошлый раз мы с вами создавали натюрморт в три этапа: сначала досконально описывали композицию, потом задавали настройки для своего фотоаппарата, а в конце «оживляли» фотографию, наполняя ее смыслами и эмоциями. Предлагаю пользоваться тем же «алгоритмом» и сейчас, и впредь – так у вас появятся стойкие навыки создания промптов для нейросети, а бонусом еще и научитесь на базовом уровне обращаться с фототехникой в ручном режиме. Если же вы и так опытный фотограф, то на втором этапе написания промптов можете смело экспериментировать с собственными настройками. Пусть каждый берет из книги только то, что считает нужным.
Перед тем, как мы начнем писать промпт, не забудьте выбрать модель Dreamer Photoreal V2 (со вкладкой Balanced в меню fine-tuning); в разделе Mode – вкладку Text to Image, а в поле Sampling Steps установите желаемое количество шагов генерации снимка (желательно не меньше 25, а вообще чем больше, тем лучше). В разделе Sampling method по умолчанию оставляем метод Euler A для создания реалистичных фотоизображений.
Что касается Aspect ratio, то на этот раз выберем формат 3:2 – горизонтальный кадр идеально подходит для создания пейзажей и крупномасштабных панорамных снимков, потому что человеческий глаз именно в таком ракурсе лучше всего воспринимает бескрайние природные ландшафты.
Давайте сегодня обратим внимание на поле Guidance Scale («соответствие запросу»), которое расположено сразу за строкой Sampling method. Здесь мы даем нейросети указание, насколько точно ей нужно выполнять промпт. По умолчанию на шкале выставлен показатель 7.0 – при этом значении ИИ довольно точно следует тексту, однако может допускать некоторые «вольности». Чем ниже число, тем больше самостоятельного творчества проявляет нейросеть, генерируя снимок, а чем показатель выше, тем ближе результат к исходному тексту. Давайте установим бегунок на отметке 8.0, чтобы с большей вероятностью получить желаемый результат.
Шаг 1
«Высокореалистичная пейзажная фотография, где на среднем плане изображена живописная горная деревушка, расположенная на равнине между холмами. Снимок сделан с более высокой точки холма на переднем плане, поэтому сверху видны цветные крыши деревни и небольшие домики. На заднем плане великолепный конусообразный вулкан, его вершина и склоны покрыты замысловатыми снежными узорами. Кадр четко разделен на три горизонтальных слоя, и акцент делается на композиционной связи между снежным плато переднего плана, деревушкой и драматичным горным пейзажем. Раннее утро, и кадр заполнен почти мистическим светом лучей восходящего солнца. Этот свет окрашивает воздух и предметы в нежные тона и создает удивительно красивые контрасты. Cбалансированные естественные цвета».
Highly realistic landscape photograph showing a picturesque mountain village in the middle ground, located on a plain between hills. The picture was taken from a higher point on the hill in the foreground, so the colored rooftops of the village and small houses can be seen from above. In the background is a magnificent cone-shaped volcano, its peak and slopes covered with intricate snow patterns. The frame is clearly divided into three horizontal layers, and the em is on the compositional connection between the foreground snowy plateau, the village and the dramatic mountain landscape. It's early morning, and the frame is filled with almost mystical light of the rising sun rays. This light colors the air and objects in delicate tones and creates amazingly beautiful contrasts. Well balanced natural colors.
Вы, наверное, заметили, что мы все более и более подробно прописываем детали композиции, дотошно объясняя содержание переднего, среднего и заднего планов. При этом можем себе позволить сочинять целые предложения, не боясь, что нейросеть нас не поймет. Английский язык благодатен в том отношении, что искусственный интеллект его прекрасно воспринимает фразами, а вот русский для него пока туговат, поэтому в русифицированных генераторах изображений ИИ улавливает смысл лишь отдельных слов и словосочетаний.
Рис. 9. Горный ландшафт с вулканом
Итак, смотрите, «художник» практически идеально выстроил композицию, передал краски и настроение раннего утра. Однако есть что-то неестественное, «рисованное» в снеге, и домики будто картонные. Поэтому давайте сразу добавим в окне Prompt следующие слова: «идеальная текстура снега, деревьев, холмов и поверхности строений» (perfect texture of snow, trees, hills and building surfaces). А в поле Negative Prompt напишем: «изменения в композиции» (changes of the composition). Вы, наверное, помните, что здесь мы прописываем то, чего хотели бы избежать при дальнейшей обработке изображения.
Ну а теперь в личном кабинете выбираем получившийся у нас снимок, нажимаем на кнопку Evolve, и в поле Prompt сразу после имеющегося текста задаем настройки для фотоаппарата.
Шаг 2
«Nikon D850, ISO 400, 1/100 с, f/11, средняя глубина резкости; фокус на деревне среднего плана, четкая, детальная прорисовка строений; зум-объектив: 120–300 мм; телеобъектив для получения детального и хорошо скомпонованного изображения с возвышенности; штатив».
Nikon D850, ISO 400, 1/100 s, f/11, middle depth of field (DOF); focus on the middle ground village, a clear and detailed drawing of the buildings; zoom lens: 120-300mm; a telephoto lens for capturing a detailed and well-composed i from an elevated position; tripod.
Давайте разберемся в новых терминах из области фотографии, а заодно и вспомним те, что нам уже знакомы. Одно из таких новых понятий – «глубина резкости». Что это такое?
Глубина резкости изображаемого пространства (по-английски – DOF) показывает, насколько фотография сфокусирована. Если основной объект находится в фокусе, но передний план или фон размыты, тогда это говорит о том, что глубина резко изображаемого пространства мала (shallow DOF). Напротив, если большинство объектов съемки находятся в фокусе, включая передний план и фон, это означает, что у фотографии большая глубина резко изображаемого пространства (deep DOF). Глубина резкости определяет, что находится в фокусе снимка, тем самым заостряя внимание на каком-то определенном объекте на изображении и не отвлекая внимание зрителя на второстепенные детали, которые автор снимка не желает акцентировать.
Понятие «глубина резкости» тесно связано с числовым показателем раскрытия диафрагмы фотоаппарата, которое, если вы помните, обозначается вот так: f/3.5, f/5.6, f/8. Чем меньше число, тем больше открыта диафрагма и тем более мелкой будет глубина резкости. Малая глубина резкости характерна, например, для натюрмортов. Чем больше числовое значение (f/16, f/22), тем больше предметов окажется в фокусе.
В пейзажной фотографии применяют как малую, так и большую глубину резко изображаемого пространства – в зависимости от того, желает ли фотограф сфокусировать внимание только на одном объекте или же хочет расширить фокус и достаточно резко изобразить большее количество деталей. При изображении горного пейзажа большая глубина резкости позволяет зрителю почувствовать расстояние от объектов переднего плана до гор, расположенных на заднем плане, так как все планы находятся в фокусе и создают ощущение глубины и объема пространства. А на психологическом уровне большая глубина резкости помогает создать на снимке расслабляющую и успокаивающую атмосферу, делая акцент на гармонии изображаемой сцены.
Для нашего ландшафтного снимка мы использовали диафрагменное число f/11, которое в фотографии обычно считается средней глубиной резкости, особенно в сочетании со средним телеобъективом. При такой глубине резкости часть снимка находится в фокусе, в то время как большая область, окружающая объект, немного или сильно размыта. Средняя глубина резкости отлично подходит для создания в целом сбалансированного изображения, где некоторое размытие фона придает снимку глубину и эстетическую привлекательность.
Еще мы сегодня столкнулись с понятием «телеобъектив». Давайте разберемся, когда его нужно применять.
Телеобъектив обычно используется в пейзажной фотографии для захвата удаленных элементов пейзажа – гор, водопадов и даже зданий. Телеобъектив позволяет «приближать» отдаленный пейзаж и снимать нужные детали, создавая ощущение обширного пространства. С помощью телеобъектива также можно изолировать отдельные элементы ландшафта – дерево, камень и т.д., создавая уникальную и эффектную композицию.
Также мы с вами использовали зум-объектив с диапазоном фокусных расстояний от 120 до 300 мм. Подобный диапазон позволяет мастеру выбрать точное расстояние, соответствующее его видению объекта, композиции и перспективы. Кроме того, зум-объектив дает возможность быстро и легко настроить угол и композицию кадра без необходимости использовать несколько объективов или перемещать камеру.
Как зум-объективы, так и телеобъективы предназначены для того, чтобы фотограф мог «приближать» объекты и делать их детальные снимки; основное же различие между ними заключается в фокусном расстоянии. Зум-объектив предлагает более широкий диапазон фокусных расстояний, что позволяет легко переключаться между различными видами без потери качества изображения и необходимости смены объектива. Телеобъектив предназначен для очень больших расстояний, обычно обеспечивая гораздо более «узкое» поле зрения и позволяя фотографу «приблизиться» к объекту съемки.
Комбинация зум-объектива и телеобъектива может значительно расширить спектр творческих возможностей фотомастера. С зум-объективом он может легко переключаться между различными углами зрения, чтобы найти правильную композицию для сцены, а телеобъектив обеспечивает более плотную композицию и фокусировку, помогая вывести объект пейзажа на передний план и создать глубину изображения. Применяя их одновременно, фотограф может уловить все детали и текстуры сцены, получая при этом четкую и привлекательную композицию.
Рис. 10. Горный ландшафт с вулканом
Пока я вам объяснял новые термины, ИИ успел выдать изображение с учетом настроек фотоаппарата и использования объективов. Давайте посмотрим, как это повлияло на снимок.
Сразу бросается в глаза, что молодой конусообразный вулкан под кистью нашего «художника» состарился и стал живописной скалой с прихотливым рельефом. Однако я не буду настаивать на том, чтобы мне вернули изначальный вариант, потому что так вышло намного красивее! Сгладилась «мультяшность» предыдущего изображения с его четко прорисованными, чересчур яркими домиками, и появилась цельность сбалансированного снимка. Более правдоподобно стал выглядеть снег, приятно акцентирована елочка на краю ближайшего к нам холма и несколько строений. Как видите, наши числовые настройки не были напрасными – наоборот, они весьма улучшили качество снимка.
Если вы решили, что на этом можно остановиться и не усовершенствовать изображение, то это ваше право. Я же предлагаю продолжить эксперимент и перейти к третьему этапу обработки ландшафта, дав нейросети инструкции по моделированию эмоционального фона нашего снимка.
Шаг 3
«Атмосфера полного умиротворения и спокойствия; горный пейзаж вызывает чувство благоговения и тихого внутреннего восторга. Вечная красота и величие момента восхода солнца в горах вдохновенно выражены с помощью света и тени, придающих сцене драматизм и яркость».
An atmosphere of complete peace and tranquility; the mountain landscape evokes a sense of awe and quiet inner delight. The timeless beauty and majesty of the moment of sunrise in the mountains is expressed with great inspiration by the use of light and shadow, giving the scene dramatic and bright character.
После этих слов, полных восхищения, не забудьте написать «заклинание», состоящее из набора нечленораздельных букв и слов: HQ, 8k, -beta -beta -beta.
Если вам интересно, что означают отдельные элементы этой абракадабры, то я их вам охотно объясню.
HQ – сокращение от high quality (высокое качество).
8k – это формат с разрешением примерно 8000 пикселей по горизонтали, позволяющий получать изображения непревзойденной четкости в цифровом кинематографе и компьютерной графике. Как вариант можете указывать формат 4k, что тоже очень круто.
Что касается -beta -beta -beta, то это вариант уже известной нам команды -upbeta, используемой в нейросети для улучшения качества изображения. Здесь главное не переусердствовать с количеством слов, так как каждое повторение команды заставляет нейросеть стараться изо всех сил, чтобы усовершенствовать рисунок, и в результате может получиться «чересчурово». Так что будьте внимательны в ходе своих экспериментов.
Рис. 11. Горный ландшафт с вулканом
Разница между вторым и третьим изображением довольно заметна, вы не находите? Роскошный рельеф вулкана вызывает у меня чувство восхищения; домики стали более резкими, но при этом не потеряли своего естественного вида, а бархатистую поверхность холмов и текстуру леса прямо ощущаешь пальцами! Так что, друзья, мы можем себя поздравить с очередным удачным снимком.
В фотографии есть понятие золотой час – время суток вскоре после восхода солнца или перед закатом, когда свет выглядит более красным и мягким, чем при высоком положении светила. «Золотой час» иногда также называют «волшебным», потому что в это время можно не бояться ни прямого солнечного света, ни жесткого контрового освещения, усложняющего процесс съемки, и все вокруг буквально залито золотом – в такие минуты снимок в любом случае получится хорошо. Давайте и мы попробуем создать предзакатный пейзаж, когда солнце вот-вот опустится за горизонт.
Prompt
Высокореалистичный фотопейзаж с причудливым безлистым деревом во время заката, когда солнце находится совсем близко к горизонту. Солнечные лучи играют в ветвях дерева и золотят пространство вокруг. В верхней части снимка на небе чудесные прозрачные облака. Потрясающая минималистичная композиция с интересными деталями; все части изображения идеально сбалансированы. Профессиональная камера с идеальными настройками для фотографии «золотого часа». Небольшая глубина резкости. Картина обладает некой мистической атмосферой и завораживает зрителя своей божественной красотой. Шедевр. Высокое разрешение, 4k, -testp, -beta beta -upbeta.
A highly realistic photography landscape with a quaint-looking leafless tree at the time of sunset when the sun is quite near the horizon. The sun rays play in the tree branches and make everything look golden. In the upper part of the pic there are gorgeous transparent clouds in the sky. Stunning minimalistic composition with interesting details; all the parts of the depiction are perfectly balanced. Professional camera with best settings for the “golden hour” pics. Shallow DOF. The picture has certain mystic atmosphere and charms the viewer with its divine beauty. Masterpiece. High res, 4k, -testp, -beta beta -upbeta.
Параметры для генерации снимка: Model – Dreamer Photoreal V2 (fine-tuning: Epic), Aspect Ratio – 1:1, Guidance Scale – 14:0, Sampling Method – Euler A, Steps – 40.
Рис. 12. Дерево в лучах закатного солнца
Вы наверняка заметили, что в этом промпте я не стал предлагать точные числовые настройки для фотоаппарата и даже не стал указывать, какой именно камерой мы делаем снимок. Вместо этого ограничился словесным описанием (профессиональная камера с идеальными настройками) и указал малую глубину резкости. Как видите, даже с таким скромным набором подсказок фотография получилась весьма эффектной и с приличным качеством. А все почему? А все потому, что в конце нашего «лирического сочинения» мы написали слово шедевр (Masterpiece). Вы можете посмеяться, но ИИ понимает каждое слово буквально и cделает все, чтобы выдать нам именно то, что мы просим. И еще открою маленький секрет: слово «шедевр» в промптах так же популярно, как и «мантра» -beta / -upbeta. Его пишут все кому не лень, однако результат далеко не у каждого получается сногсшибательный: чтобы создать в нейросети настоящее произведение искусства, нужно потратить немало времени и сил на поиски верного слова. Так что, друзья, запасайтесь терпением, баллами для работы (credits) – и вперед, к вершинам художественного мастерства!
Глава 4. Портрет
Сегодня мы поработаем в прекрасном жанре фотопортрета, не возражаете?
Портрет в фотографии – это изображение человека или группы людей, созданное фотографом для изображения его / их внешности и характера. Портрет может отражать особые физические и психологические качества человека или фиксировать эмоции, которые он в этот момент испытывает. Портреты могут быть постановочными или спонтанными. Выбор места, композиции и освещения имеет важное значение в портретной фотографии и позволяет мастеру передать личность объекта, отношение к ситуации и эмоциональное состояние.
Хочу сразу предупредить: принимаясь за создание реалистического изображения человека в нейросети, мы можем столкнуться с проблемами весьма деликатного характера: ну, допустим, у нашего фотоперсонажа вдруг окажется четыре ноги, от трех до семи пальцев на руках, кожа на шее нежно-зеленого оттенка и т.п. Прежде всего желательно сразу принять тот факт, что нейросеть никогда не видела человека собственными глазами (хотя бы потому, что у нее нет глаз!), поэтому, получив в ответ на своей запрос неадекватный рисунок, не надо на нее визжать и в гневе швырять телефон наземь. Всегда следует помнить: мы в состоянии исправить любой допущенный машиной «косяк», дав ей четкие указания, что нужно и чего не нужно рисовать в человеческом теле.
Советую сразу запомнить несколько слов и словосочетаний, которые всегда обязательно прописывать в промптах, если вы работаете с «фотографией» человека: «реалистичный» (realistic), сверхреалистичный (super realistic / hyper realistic), «идеальная текстура человеческой кожи» (ideal human skin texture), «живые и выразительные глаза» (lively and expressive eyes), «реалистичные человеческие зрачки» (realistic human-like pupils), «естественное выражение лица» (natural face expression), «реалистичный цвет лица и тела» (realistic face and body color).
И желательно сразу писать в поле Negative Prompt то, чего следует избегать нейросети при генерации снимка: «нереалистичная форма носа / глаз / рта» (unrealistic form of the nose / eyes / mouth), «плохо нарисованные пальцы / руки / ступни» (badly drawn fingers / hands / feet), «неестественное выражение лица» (unnatural facial expression), «слишком много / мало пальцев на руках / ногах» (too many / few fingers on hands / feet), «нереалистичные глаза / зрачки» (unrealistic eyes / pupils).
Итак, если вас не испугали возможные трудности при изображении человеческого лица и тела, то предлагаю сделать выразительный снимок… ну, допустим, чернокожей девушки в белоснежной одежде. Что, круто? Да, мне тоже нравится эта идея!
Обычный формат для создания портретов – 2:3, но сегодня я хочу вам предложить поработать с менее привычным для этого жанра форматом 1:1, потому что с ним иногда удается добиться более выразительных изображений. Поэтому в поле Aspect Ratio выбираем это число – и поехали!
Шаг 1
«Реалистичный портрет чернокожей улыбающейся девушки 19 лет, изображенной по грудь и стоящей в три четверти на фоне белой стены. У стены шероховатая текстура, которая контрастирует с гладкой кожей лица девушки. Девушка одета в стильное белое платье, на ней белая шляпа и аксессуары. У нее уверенное и немного ироничное выражение лица, а в блестящих глазах прочитывается легкий смех. Текстура кожи идеальная, лицо очень реалистичное; у девушки в высшей степени реалистичные глаза с живыми и выразительными человеческими зрачками. Весь облик девушки несет яркие и позитивные вибрации. Композиция фокусируется на слегка подсвеченном лице девушки; задний план отличается эффектной драматической подсветкой и имеет легкое размытие, что придает снимку глубину и зрительно отделяет персонажа от стены. Изображение носит стильный и привлекательный характер».
A highly realistic chest-deep portrait of a black smiling girl aged 19, standing three-quarters against a white wall. The wall has a rough texture that contrasts with the girl's smooth skin. The girl is dressed in a stylish white dress, she is wearing a white hat and accessories. Her face has a confident and slightly ironic expression, and gentle laughter can be read in her sparkling eyes. The texture of her skin is perfect, the face is very realistic; the girl’s eyes are extremely realistic, with lively and expressive human-like pupils. The girl’s whole appearance carries bright and positive vibes. The focus is on the girl's slightly rim-lit face; the background is spectacularly backlit and has subtle blur that adds depth to the shot and separates the subject from the wall. The i is stylish and attractive.
Рис. 13. Портрет чернокожей девушки
Ну что, как вам портрет? По-моему, превосходный! Эта очаровательная юная леди в белом – само совершенство, не находите? И вообще изображение исполнено внутренней гармонии и динамизма – возможно, благодаря квадратной форме снимка, а может, потому, что он черно-белый.
Ладно, похвалили сами себя – и дальше за работу: нам нужно правильно настроить камеру и свет в студии, чтобы не испортить такое удачное начинание.
Шаг 2
«Canon 5D Mark IV с объективом Canon 135 мм f/2.0 L. Камера на штативе, направлена на девушку, зум объектива установлен на фокусное расстояние 105 мм. ISO 400, 1/200 с., f/3.5. Вспышка состоит из двух выносных стробоскопов, одного для основного света в студии и одного для контрового / контурного света: это обеспечивает драматичную и реалистичную настройку освещения, чтобы подчеркнуть черты лица девушки и фон.
Canon 5D Mark IV, with a Canon 135 mm f/2.0 L lens. The camera is on a tripod, aimed at the girl, and the lens zoom is set to the 105 mm focal length. ISO 400, 1/200 s., f/3.5. The flash equipment consists of two off-camera strobes, one for main lighting in the studio and one for back/rim lighting, providing a dramatic and realistic lighting setup to bring out the girl's features and the background.
Сегодня мы с вами познакомились с несколькими типами освещения, которые используются при создании фотопортрета. Это основной свет (main light / key light) и контровой, или контурный свет (backlight / rimlight).
Как основной, так и контурный свет являются стандартными методами освещения, используемыми в портретной фотографии. Основное освещение – это основной источник света, используемый для освещения объекта и придания глубины изображению. Его можно расположить спереди или немного сбоку от объекта, создавая блики и тени для более реалистичного и трехмерного вида. Контурный свет является вторичным источником света, который размещается позади объекта, освещая его сзади и по бокам и создавая красивую окантовку. Эта техника используется для создания тонкого свечения и отделения объекта от фона, добавляя изображению глубину и «гламурный» вид.
Рис. 14. Портрет чернокожей девушки
Мне кажется, снимок стал немного темнее, и чтобы при следующей обработке еще больше не прибавилось мрака, давайте сразу запишем в поле Negative Prompt: «слишком темное изображение» (too dark i). Что же касается технической стороны фото, то разница, на мой взгляд, очевидна: изображение стало глубже, девушка словно выдвинулась на передний план, благодаря освещению проявилась текстура шляпы и платья.
Но что же произошло с самой девушкой? Вам не кажется, что она немного повзрослела, пока фотограф настраивал свое оборудование? Из лица красотки ушла некая детскость и простота, делавшие ее такой очаровательной. Сейчас глаза немного насмешливо прищурены, а в уголке рта появилось ироничное выражение. Хм… Даже интересно, что же с девушкой будет дальше. Впрочем, давайте не будем гадать, а просто перейдем к третьему этапу работы – если хотите, конечно…
Шаг 3
«Благодаря харизме и внутренней подвижности девушки у снимка очень притягательная аура. От него исходит мощная энергия уверенности и оптимизма. Образ имеет едва уловимую игривую нотку, но полон внутренней силы и драматизма. Фото покоряет своим обаянием, вдохновляет и целиком захватывает внимание зрителя. HQ, 8k, -testp, -beta -upbeta -beta».
Thanks to the girl’s charisma and her inner mobility, the shot has a very attractive aura. It produces a powerful energy of confidence and optimism. The i has a subtle playful note, but is full of inner strength and drama. The pic captivates with its charm, inspires and captures completely the viewer’s attention. HQ, 8k, -testp, -beta -upbeta -beta.
Вы, наверное, заметили, что у нас очень обстоятельные промпты, целые эссе, а вот текстовая вместимость в поле Prompt ограничена 1500 знаками. Что делать, если мысль еще не закончена и кое-что хочется обязательно добавить, а места уже нет? Все просто: в английском тексте можете убирать артикли перед существительными, а сами существительные заменять местоимениями – умный ИИ в любом случае вас поймет. Еще избегайте повторений, если только они не сделаны специально, чтобы привлечь внимание нейросети. А вот точками и запятыми не пренебрегайте, чтобы вместо четкой идеи не получилась каша. Словом, подходите к делу творчески и не бойтесь экспериментировать, а насколько удачно вы это будете делать, покажут ваши изображения.
Рис. 15. Портрет чернокожей девушки
Итак, что мы имеем на выходе? Изображение в целом смягчилось, стало более сбалансированным; ушла резкость при передаче фактуры ткани; девушку оставило чересчур ироничное настроение, и в ее облике снова появилась мягкость, несколько утраченная во втором снимке. И хотя в лице героини больше нет детской открытости, она от этого не стала менее привлекательной и харизматичной.
Среди любителей создавать изображения в нейросетях популярен метод выделения важных текстовых моментов с помощью числовых обозначений: 0.8, 1.4, 1.9 и т.д. – в целом диапазон колеблется от 0.0 до 2.0. Логично предположить, что чем больше число, тем сильнее вы хотите подчеркнуть ту или иную деталь в картинке. При создании портрета таким образом акцентируют глаза, кожу, волосы и т.д. Допустим, если в женском лице вы хотите лишь намекнуть на подводку для глаз, то можете ограничиться числом 0.5. А для прически можно использовать более высокий показатель, например, 1.5. Здесь главное не переусердствовать, особенно с макияжем и тоном кожи, а то получите картинку с какими-нибудь красно-желто-фиолетовыми пятнами по всему телу.
Выделения с помощью чисел обычно оформляются следующим образом: (волнистые волосы: 1.6) или (пухлые губы: 1.3). Деталь, которую вы хотите акцентировать, нужно взять в скобки, чтобы нейросеть ясно понимала, на что именно обращать особое внимание.
Давайте для примера напишем промпт для создания фотографии молодой женщины, используя подобные числовые показатели.
«Высокореалистичный портрет поразительно красивой женщины примерно 28 лет, которая сфотографирована по грудь. Она идеально выглядит, очень чувственна, элегантно одета, но имеет немного (разочарованное и усталое выражение глаз: 0.7); в руке у нее (бокал вина: 1.8). (Подводка для глаз: 1.1); (реалистичная кожа: 1.2); живые выразительные глаза с (реалистичными зрачками: 1.3); (волнистые волосы платинового цвета: 1.4); (выразительный рот с утонченными губами: 1.5). В целом, в образе женщины есть что-то загадочное и притягательное. Идеальные настройки камеры для тускло освещенного бара. Малая глубина резкости. HQ, 4k, -testp, -beta -beta -beta».
A highly realistic chest-deep portrait of a strikingly beautiful woman of about 28 years old. She looks perfect, she is very sensual, dressed elegantly, but has a bit (disappointed and tired expression in her eyes: 0.7). She has (a glass of wine: 1.8) in her hand. (Eyeliner: 1.1); (realistic skin: 1.1); lively expressive eyes with (realistic pupils: 1.3); (wavy blonde platinum hair: 1.4); (expressive mouth with refined lips: 1.5). There's something mysterious and captivating in the overall i of the woman. Perfect camera settings for a dim-lit bar space. Shallow DOF. HQ, 4k, -testp, -beta -beta -beta.
Параметры для генерации изображения: Model – Dreamer Photorealistic V2, Style – Photography: Realistic / Cannon EOS 5D Mark IV, -ar 2:3, Guidance Scale – 9.0, Sampler – Euler A, Steps – 40.
Рис. 16. Портрет женщины с бокалом
Портрет получился чудесный, и отличить изображение от настоящей фотографии довольно трудно (если, конечно, сильно не всматриваться – тогда будут заметны некоторые ляпы). Нам повезло ничего не напортачить с числовыми показателями, поэтому, если вы захотите поэкспериментировать в промптах с числами, смело это делайте, ну а мне, гуманитарию, все-таки проще и привычнее управляться со словами.
Изображения с человеческими лицами можно совершенствовать до бесконечности, добиваясь все большего правдоподобия и выразительности, но иногда полезно остановиться, на какое-то время отложить снимки, а потом окинуть их свежим взглядом – тогда вдруг ясно высветятся недостатки, которых мы не заметили в процессе работы, и придут свежие идеи о том, как улучшить фотографию. Поэтому предлагаю вам отдохнуть от портретов и поработать с каким-нибудь другим жанром – уверяю, это будет не менее интересно и познавательно.
Глава 5. Уличная фотография
Вам не кажется, что мы засиделись дома в окружении своих питомцев или в студии, погруженные в создание натюрмортов и портретов? Не пора ли нам выйти на улицу – подышать свежим воздухом, а заодно попробовать себя в жанре уличной фотографии?
Уличная фотография – это очень динамичная и откровенная форма фотоискусства, разновидность социальной фотографии, которая предполагает создание снимков в общественных местах (на улицах, тротуарах, площадях, в зданиях, переулках) с целью запечатлеть правдивые моменты современной жизни, а также сцены взаимодействия между людьми. Фотограф пытается передать атмосферу, сущность, характер улицы, взаимодействуя с окружающей средой и людьми и ставя перед собой цель получить естественные и спонтанные кадры. В жанре уличной фотографии ценится реальность момента, а не талантливая режиссура сцены, поэтому такие снимки часто делаются при помощи телеобъектива (наверное, чтобы не смущать участников событий). Работа в этом жанре может стать отличной тренировочной площадкой для фотографов, поскольку позволяет им совершенствовать навыки в композиции и умении рассказывать истории.
Однако если фотограф умеет подсмотреть историю и «рассказать» ее с помощью готового снимка, то нам для начала нужно самим придумать ситуацию или описать интересный момент, свидетелем которого когда-то стали. Давайте словами «нарисуем» уютную сцену кормления птиц на площади или бульваре – вы наверняка не раз ее наблюдали – и опишем детали этой картины в промпте.
Так как из-за обилия объектов композиция на этот раз будет сложнее предыдущих, то приготовьтесь к тому, что поначалу ИИ будет выдавать нам совсем не такие качественные изображения, как в более простых снимках. Пока что для него еще очень сложно реалистично изобразить фигуру человека в различных ракурсах и адекватно передать черты лица. Запаситесь терпением, несколькими десятками баллов (credits) и раз за разом просите машину улучшить снимок, сделав его как можно более похожим на настоящее фото.
Сегодня мы познакомимся с одним важным инструментом для того, чтобы дать ИИ понять, на что именно ему нужно обратить внимание при генерации изображения – это функция «вес слова». Как мы с ней работаем? В полях Prompt и Negative Prompt выделяем скобками те слова, которые вам кажутся наиболее важными, при этом чем больше скобок окружают слово или словосочетание, тем больший вес оно приобретает в «глазах» нейросети. Допустим, запись может выглядеть так: (реалистичное лицо), ((гладкая текстура кожи)), (((идеально нарисованные пальцы))) и т.д. Непосредственно в тексте эти слова будут автоматически выделяться разными цветами – синим, красным и т.п.
Ну что, начинаем работать? В этот раз мы с самого начала пропишем наши «условия» как в поле Prompt, так и в Negative Prompt. Тем самым мы сразу дадим нейросети понять, что мы желаем и чего не желаем видеть на снимке. Ну а слова в скобках уже сами будете выделять: вы лучше знаете, что для вас важнее.
Шаг 1
«Высокореалистичная уличная фотография: на переднем плане молодой человек в костюме, сидя на корточках, кормит голубей. Птицы гуляют по мощеной площади. На заднем плане на площади европейского города работает фонтан. Совершенная анатомия лица, идеальные реалистичные руки и пальцы, идеальная текстура кожи человека. Высокореалистичная текстура зданий, тротуара, воды в фонтане и фигур людей. Композиция с энергичным, необычным ракурсом. Естественный уличный свет днем после 17 часов, непрямые лучи солнца дают мягкое, но в то же время динамичное освещение картины. Длинный телеобъектив установлен под широким углом, чтобы создать глубину и ощущение перспективы в кадре. Увеличение масштаба с помощью зум-объектива, чтобы показать мужчину в центре кадра: акцент на его фигуре. -ar 3:2, high res, 8k, -testp, -beta -beta -beta».
Highly realistic street photography: in the foreground, a young man in a suit feeds pigeons while squatting. Birds walk on the paved square. In the background a fountain is working in the square of a European city. Perfect face anatomy, ideal realistic hands and fingers, perfect human-like skin texture. Highly realistic texture of buildings, pavement, fountain water, and people’s figures. A composition with an energetic, unusual angle. Natural street light in the afternoon, after 5 p.m. , the indirect rays of the sun give a soft, but at the same time dynamic lighting of the picture. The long telephoto lens is mounted at a wide angle to create depth and a sense of perspective in the frame. Zoom in to show the man as the center of the shot: focus on his solitary figure. -ar 3:2, HQ, -testp,8k, -beta -beta -beta.
Negative Prompt
«Уродливое нереалистичное лицо человека, неестественная поза человека, ужасно смоделированные руки и пальцы, нереалистично нарисованная вода в фонтане, нереалистичные птицы».
Ugly unrealistic human face, unnatural human posture, poorly modeled hands and fingers, unrealistically drawn water in the fountain, unrealistic birds.
В основном промпте мы ввели термин, употребляемый при работе с нейросетью: -ar 3:2. Вы наверняка догадались, что буквы -ar – это не что иное, как сокращение от Aspect Ratio – «формат изображения». И хотя эта функция есть в отдельном поле приложения, но если теперь вы вдруг увидите в сети промпт с такими символами, то будете знать, что они означают.
Еще вы, наверное, заметили, что мы прямо на первом этапе работы ввели специальные символы, характерные для промптов, которые обычно прописывали в конце. Мы это сделали для того, чтобы нейросеть с самого начала принялась улучшать качество снимка и в конце довела его до совершенства.
Рис. 17. Мужчина, кормящий птиц на городской площади
Итак, вот что у меня получилось примерно с двадцатой попытки получить мало-мальски вразумительное изображение при постоянных изменениях и дополнениях в окнах Prompt и Negative Prompt: довольно адекватная (хотя и пустоватая на среднем плане) композиция, анатомически верная фигура сидящего на корточках человека, человеческое (слава богу!) лицо с чертами, не вызывающими ступора. Строение кисти, правда, немного настораживает, ну да ладно, в глаза вроде не сильно бросается, исправим в дальнейшей работе.
Лицо мужчины окончательно приобрело свой человеческий вид после того, как я перевел его в высокое разрешение. Чтобы сделать это, вам нужно на странице снимка с его описаниями (в разделе History вашего личного кабинета) нажать внизу желтую кнопку High-res fix («перевод в высокое разрешение»), на которой пока что в красном поле написано Unlock («разблокировать»). Когда вы разблокируете эту функцию путем просмотра рекламы, вам станет доступна шкала с тремя режимами улучшения качества снимка: Followoriginal, Normal, MoreCreative («Близко к оригиналу», «Нормальный», «Более творческий»). Можете поэкспериментировать с каждым из них, а можете сразу выбрать третий, он дает самое высокое качество.
Так как изображение человека – самая «опасная зона» при работе с нейросетью, то на остальные ляпы пока можно не обращать внимания, хотя их здесь предостаточно: птички неопределенной породы; какие-то плоские, почти картонные дома; явно рисованный фонтан и летающая над ним птица – судя по размерам, не меньше орла.
Теперь будем исправлять и улучшать изображением, придавая ему максимально близкое сходство с настоящим снимком. Для этого нам необходимо задать настройки для фотоаппарата – так до нейросети скорее дойдет, что мы хотим получить фотографию, а не образчик реалистического рисунка.
Шаг 2
«Canon 5DS R, объектив Canon EF 70-200mm f/2.8L IS II USM, штатив. 1/200 с, f/7.1, ISO 200, зум установлен на фокусное расстояние 105 мм».
Canon 5DS R, a Canon EF 70-200mm f/2.8L IS II USM lens; tripod. 1/200 s, f/7.1, ISO 200, the lens zoom is set to 105mm focal length.
Рис. 18. Мужчина, кормящий птиц на городской площади
Итак, давайте посмотрим, есть ли у нас улучшения… Да, фотография однозначно стала более качественной! Благодаря неглубокому полю резкости, полученному в результате установки диафрагмы в режим f/7.1, у изображения появился объем, что позволило, как говорят фотографы, «отбить» мужчину от фона и выдвинуть его зрительно на первый план. Лицо персонажа теперь более живое, улучшилась анатомия его правой кисти – строение пальцев больше не вызывает вопросов. Фонтан стал более реалистичным и уже не выглядит как иллюстрация к сказке Андерсена. Улетел орел, паривший над фонтаном – пожелаем ему доброго пути! У строений благодаря «воздуху» на снимке появился объем, и они больше не создают впечатление картонных коробок.
Словом, мы еще раз убедились в том, что использование числовых настроек камеры сразу поднимает снимок на новый качественный уровень! Нейросеть сама ведь состоит из набора цифровых символов, поэтому иногда число может дать ей более понятную (и гораздо более краткую, чем словесное описание) инструкцию. Так что советую разобраться с базовыми установками фотоаппарата на уровне экспозиции (выдержка + диафрагма + светочувствительность) и ознакомиться с основными типами объективов.
Шаг 3
«Мгновенная и одновременно вневременная сцена, изображающая мирную сторону человеческого существования, с мечтательной, теплой и нежной атмосферой. Идеально подходит для тех, кто ищет творческого вдохновения в минуты спокойствия, мира и гармонии».
An instant and, simultaneously, timeless scene, portraying the peaceful side of human existence, with a dreamy, warm and gentle atmosphere. Perfect for those who look for artistic inspiration in a moment of tranquility, peace and harmony.
Рис. 19. Мужчина, кормящий птиц на городской площади
Ну что, как вам последняя фотография? На мой взгляд, она замечательная. Солнце словно опустилось еще ниже, и освещение стало идеальным, приглушив здания на фоне изображения и высветив птиц, который наконец-то приобрели… ха-ха, чуть было не сказал: человеческий облик! – приобрели естественный вид – по крайней мере, в плане окраса. У фонтана появилась чудесная воздушная прозрачность, почти ощущается прохлада воды, создавая атмосферу покоя и умиротворения, о которых идет речь в заключительной части нашего промпта.
Сейчас мы с вами познакомимся с одной интересной, веселой функцией, которая называется Shuffle («перетасовка», «перемена мест»): с ее помощью все объекты на изображении смешиваются в кучу, переставляются с место на место, и в результате получается совершенно иная композиция – зачастую с новыми персонажами и предметами.
Для того чтобы совершить такую операцию, сначала убедитесь, что в поле Prompt у вас написан текст полученного изображения (помните, вы можете его сюда поместить путем клонирования – Clone). Далее, в разделе Mode выбираем режим Text to Image, и в появившемся ниже поле ControlLayer нажимаем справа на плюсик в кружочке. Перед нами появляется чистое поле, в которое мы помещаем наш снимок с кормлением птиц – для этого в рабочем кабинете вы должны его скачать в галерею и уже оттуда переместить в окно Control Layer. Когда снимок загрузиться, из нескольких квадратов, расположенных над этим окном, выбираем Shuffle, а потом на «шкале условия» (Conditional scale) устанавливаем числовое значение от 0.0 до 2.0. Чем выше число, тем более драматическими окажутся изменения – единички вполне достаточно для того, чтобы удивить нас результатом. Далее, устанавливаем галочку в квадратике ниже шкалы, чтобы избежать предварительной обработки изображения, и внизу нажимаем на большую желтую кнопку Add («добавить»), в которой мелким шрифтом предупреждают, что за данную услугу с нас снимут дополнительный балл. После этого нас снова возвращают на страницу редактирования, где мы нажимаем на кнопку Start Drawing и ожидаем результата.
У меня в результате перетасовки получилась такое вот идиллическое фото.
Рис. 20. Кормление птиц на площадиПрактическое задание: составьте детальный промпт с описанием этой фотографии по схеме: особенности композиции + настройки фотоаппарата и освещение + художественное содержание. Для выделения важных деталей пользуйтесь скобками или числовыми значениями.
Написав основной текст, составьте Negative Prompt. Для этого попросите ИИ убрать из снимка все нереалистичные детали, которые есть в изображении, и изменить то, что считаете нужным.
Сгенирируйте столько снимков, сколько необходимо для получения качественного результата. Не забудьте переводить удачные снимки в высокое разрешение (High-res fix) по схеме, описанной в начале главы.
Поздравьте себя с отличной выполненной работой!
Знаете, на свежем воздухе так хорошо, что хочется задержаться здесь подольше. Почему бы нам в следующей главе еще не побродить по улицам и не поснимать, допустим, здания и прочие архитектурные сооружения? – теперь уже в качестве полноправных фотоперсонажей.
Глава 6. Архитектурная фотография
Как я и обещал, сегодня мы вновь выйдем на улицу и поснимаем дома или другие строения – лестницы, мосты и т.д. Иными словами, попрактикуемся в архитектурной фотографии.
Архитектурная фотография – это жанр, где объектом съемки являются уличные сооружения, здания или их отдельные части – двери, окна, ступени, а цель работы – подчеркнуть визуальные качества и художественные достоинства объектов. Фотограф, работающий с архитектурой, стремится не только запечатлеть эстетику постройки и наглядно продемонстрировать ее функциональное значение, но и раскрыть уникальную историю, выявить тайную сущность сооружения. В архитектурных снимках акцент часто делается на линиях и формах домов, особое внимание уделяется свету, тени и перспективе. Фотограф стремится точно передать детали, цвета и материалы архитектурного объекта, чтобы продемонстрировать его особенности и передать ощущение места и атмосферы. Стилю архитектурной фотографии обычно присущи реализм, глубина и ощущение пространства.
Работа с нейросетью хороша тем, что мы можем себе позволить посетить любой уголок мира и «сфотографировать» все что угодно. Сейчас я предлагаю мысленно перенестись в Венецию и сделать снимок одного из ее потрясающих видов. Венецианские дворцы на весь мир славятся своей красотой и великолепно подходят для экспериментов в области архитектурной фотографии.
Ну что, приступим? Только для начала в поле Aspect Ratio выберем формат 1:1, так как квадратная форма кадра иногда помогает более выгодно подчеркнуть детали зданий, улиц и городских ландшафтов.
Шаг 1
«Высокореалистичное фото венецианской архитектуры с красивыми палаццо и собором с большим куполом. Здания стоят прямо у голубой воды канала. На переднем плане гондола, привязанная к «пали» – одному из особых венецианских столбов, которые выглядывают из воды. Очень реалистичная водная поверхность и отражения в канале. В кадре нет людей. Небо разных оттенков синего, покрытое эффектными облаками, составляет важную часть композиции. Совершенная, реалистичная текстура неба, воды и зданий. Снимок передает суть зданий посредством светотени, композиции и перспективы. Снято с небольшого расстояния. Время – позднее утро, около полудня».
A highly realistic photo of Venetian architecture with its beautiful palazzos and a cathedral with a big dome. The buildings stand right near the blue water of a canal. There’s a gondola in the foreground, tied to a “pali”, one of the special Venetian poles sticking out of water. Highly realistic water surface and reflections in the canal. No people in the frame. The sky of different tones of blue is covered with dramatic clouds, it forms an important part of the composition. Perfect and highly realistic textures of the sky, water and buildings. Perfect balance of colors, light and shadow. The shot captures the essence of buildings through chiaroscuro, composition and perspective. Taken from a short distance. It's late morning time, around noon.
Рис. 21. Венеция: вид на собор
Если вы никогда не были в Венеции, то теперь хотя бы представляете, как она выглядит – согласитесь, хотелось бы проснуться и, выглянув из окна, увидеть чудесную воду канала и гондолы возле старинного палаццо. На этом изображении можно заметить, что стены кое-где обшарпаны или кирпич потемнел от времени, но это лишь придает городу необъяснимое очарование подлинной старины.
Надо отметить, что ИИ максимально точно создал снимок по описанию. Напоминаю: если вы хотите видеть именно то, что заказывали, то в поле Guidance Scale следует установить бегунок на шкале на отметке выше 7.0: чем больше число, тем точнее нейросеть будет следовать вашему промпту.
Если же вас полностью устроил получившийся снимок, то перед тем, как его усовершенствовать, при этом оставив нетронутой композицию и основные детали, не забудьте в режиме Image to Image зайти в поле Prompt Strength и установить на шкале как можно меньший числовой показатель – примерно до 3.5, потому что при более высоких числах нейросеть будет проявлять повышенную творческую самостоятельность.
Шаг 2
«Sony Alpha A7 IV, объектив Sigma 24-70mm f/2.8 Art DG DN HSM; фокусное расстояние 70 мм. ISO 100, f/11, 1/80 с. Равномерное освещение строений, что позволяет детально рассмотреть богатые детали архитектуры. Фото освещено естественным солнечным светом, смягченным облаками. Акцент на куполе церкви. Необычный ракурс; средняя глубина резкости».
Sony Alpha A7 IV, Sigma 24-70mm f/2.8 Art DG DN HSM lens; focal length 70 mm. ISO 100, f/11, 1/80 s. The lighting on the building is even, allowing the rich details of the architecture to be visible. The shot is lit with natural sun light softened with clouds. Focus on the dome of the church; unusual angle; shallow DOF.
Здесь снова появилось понятие «глубина резкости» (DOF), давайте вспомним, как она регулируется с помощью настроек диафрагмы (числа f-stops):
f/22 – глубокая глубина резкости, все в фокусе;
f/11 – средняя глубина резкости, некоторые элементы размыты;
f/8 – глубина резкости меньше средней, фон все еще размыт;
f/4 – малая глубина резкости, фокус на основном объекте.
Рис. 22. Венеция: вид на собор
После настроек в фотоаппарате наш снимок кажется немного поблекшим, но это совершенно естественно: в изображении появилась воздушная прослойка, которая слегка размывает очертания предметов и приглушает краски. Кроме того, в полдень, при прямых солнечных лучах гораздо труднее сделать такой отчетливый, контрастный снимок, какой сгенерировала нейросеть в первый раз. Так что купол теперь не нависает на Венецией, драматически противостоя давлению неба с перенасыщенными красками, а возносится к легким облакам. Если вы это ощущаете благодаря фотографии, то, значит, мы свою задачу выполняем правильно!
Ну а сейчас «нанесем на картину последние штрихи» и попробуем описать настроение, передать словами атмосферу этого изображения – пусть ИИ пошевелит своими нейронами, еще больше «оживляя» снимок с помощью наших финальных подсказок.
Шаг 3
«Захватывающий и незабываемый вид. Старинные венецианские палаццо с их кое-где обшарпанными стенами – словно метафора хрупкости рукотворной красоты перед лицом неумолимого хода времени. В то же время купол, вознесшийся к небу – символ гордого, бессмертного человеческого духа. Все эти дома – как отдельные ноты, каждое со своим характером, но благодаря каналу они слились в один благозвучный аккорд: вода, наполняющая Венецию, и является той вечной незримой связью, которая позволяет зданиям гармонично сосуществовать друг с другом и вести свой безмолвный монолог. HQ, 8k, -testp, -upbeta -beta -upbeta».
A breathtaking, unforgettable view. Ancient palazzos with their here and there shabby walls are like a metaphor of the fragility of man-made beauty in the face of the inexorable passage of time. At the same time, the dome rising to the sky is a symbol of the proud, immortal human spirit. The houses are like separate notes, each with their own character, but thanks to the canal they merged into one euphonious chord: the water that fills Venice is that eternal invisible connection that allows the buildings to harmoniously coexist with each other and conduct their silent monologue. HQ, 8k, -testp, -upbeta -beta -upbeta.
Рис. 23. Венеция: вид на собор
Изображение стало более отчетливым и фактурным – так бывают, когда на солнце набегает облако. У собора словно поменялся характер, правда? Здания стали более фактурными, в них прибавилось естественных неровностей; резче проступила зелень на балкончиках и окнах – словом, фото наполнилось тихой, неприметной жизнью, как мы и написали в последней части промпта.
Венеция не всегда выглядит столь величественно. Стоит свернуть с Гранд-канала в сторону, и вы очутитесь в узком «проливе» между зданиями. Здесь царит иная, загадочная атмосфера и стоит удивительная тишина, особенно ранним утром, когда город только просыпается. Давайте сделаем снимок утренней Венеции – спокойной, чуть скрытой в тумане.
Prompt
«Реалистичная фотография венецианского палаццо с его красивыми архитектурными деталями: балконами и арочными окнами. Здание обращено к каналу с зеленой водой, в кадре нет людей. Снято с небольшого расстояния. На среднем плане рядом с палаццо стоят пустые гондолы. На заднем плане мы видим фасады других палаццо из камня, мрамора и гранита. Раннее утро, легкий туман. Кадр освещен мягким утренним светом, который создает романтическое настроение. Необычный ракурс; акцент на ближайшем к зрителю палаццо; эффект мягкого боке, малая глубина резкости. Canon 6D Mark II с объективом Canon TS-E 45 мм f/2,8. Камера на штативе направлена на палаццо, угол наклона объектива – 10 градусов, а зум объектива установлен на фокусное расстояние 25 мм. 1/80 с, f/7.1, ISO 400. Неяркий свет раннего утра, умиротворение в природе, зыбкая тишина в воздухе перекликаются со скромным нефасадным видом города: они словно высвечивают тайную связь зданий друг с другом и с каналом. High res, 4k, -testp, -upbeta beta -beta».