Читать книгу «Мастерство промт-инжиниринга (для новичков)» онлайн полностью📖 — Misha Ford — MyBook.
image

Глава 1: Основы составления промтов

Составление промтов – это искусство общения с нейросетями, которое помогает эффективно передать ваши идеи для получения желаемого результата. Промт – это текстовое описание, которое нейросеть интерпретирует, чтобы создать текст, изображение, музыку или видео. Умение правильно составлять промты открывает перед вами бесконечные возможности в творчестве и решении повседневных задач.

Структура промта:

Хорошо сформулированный промт должен быть структурирован и содержать такие элементы, как:

Объект запроса: Опишите, кто или что является основным элементом вашего запроса.

Детали объекта: Уточните размер, форму, цвет, действие или положение объекта.

Фон или контекст: Опишите, где или в каких условиях находится объект.

Стиль и атмосфера: Укажите художественный стиль, цветовую палитру, настроение или другие эстетические характеристики.

Дополнительные параметры: Если работаете с продвинутыми системами, добавляйте технические параметры, такие как соотношение сторон или уровень детализации.

Примеры простых и сложных промтов

Простые промты передают общую идею:

«Нарисуй закат».

«Создай портрет собаки».

Сложные промты содержат дополнительные детали, чтобы точнее описать желаемый результат:

«Нарисуй закат над морем, где солнце касается воды, а небо окрашено в оранжевые и розовые тона».

«Создай портрет женщины в футуристическом костюме с элементами киберпанка, окружённой неоновыми огнями города будущего».

Чем больше деталей вы предоставите, тем точнее нейросеть сможет выполнить ваш запрос. Например, в запросе для MidJourney можно использовать параметры:

«Фантастический лес с ярко светящимися деревьями, магическими существами, в стиле импрессионизма —ar 16:9» (где "–ar" обозначает соотношение сторон).

Вот универсальная формула для создания промта для изображения с переменными в квадратных скобках:

"[Сюжет] в [обстановке], с [деталями/действиями], в [настроении/стиле], освещённое [освещением], с [дополнительными элементами]."

Примеры:

"Робот в [футуристическом городском ландшафте], с [светящимися деталями и механическими элементами], в [стиле научной фантастики], освещённый [неоновыми огнями], с [летающими машинами и небоскрёбами на фоне]."

"Молодая женщина в [спокойном саду], с [развивающимися волосами и мирным выражением лица], в [мягком и мечтательном стиле], освещённая [солнечными лучами, проникающими через деревья], с [порхающими вокруг бабочками]."

Ты можешь подставить любые переменные в квадратные скобки для создания различных сценариев!

Простые и сложные запросы: разница

Простой запрос: «Нарисуй цветок». Нейросеть может предложить разные варианты, но они могут не совпадать с вашим представлением, поскольку запрос слишком общий.

Сложный запрос: «Нарисуй крупный красный розовый бутон с каплями росы на лепестках, на фоне зелёной листвы, в реалистичном стиле». Здесь нейросеть получает более чёткие инструкции, и вероятность точного результата возрастает.

Полезные рекомендации

Будьте точны. Определите, какие элементы важны для вашего результата.

Экспериментируйте. Попробуйте разные формулировки, чтобы найти ту, которая даёт оптимальный результат.

Уточняйте стиль. Если вам важен художественный стиль, укажите это. Например, "в стиле Ван Гога" или "в минималистичном стиле".

Используйте ключевые слова. Например: "яркий", "неоновый", "абстрактный".

Работайте с параметрами. Для систем вроде MidJourney добавляйте параметры: "–v 5" для выбора версии, "–ar 16:9" для соотношения сторон, "–s 500" для уровня стилизации.

Сформировав чёткий и детализированный промт, вы не только увеличите вероятность получения качественного результата, но и сократите время на корректировку. Понимание основ структуры промта – это фундамент для всех последующих глав и задач, связанных с работой с нейросетями.

Глава 2: Промты для визуальных нейросетей

Промты для визуальных нейросетей, таких как MidJourney, позволяют превращать текстовые описания в уникальные изображения. Чтобы эффективно работать с такими системами, важно понимать, как использовать параметры, которые расширяют возможности настройки и помогают получить нужный результат.

Основы работы с MidJourney

MidJourney – это визуальная нейросеть, работающая через Discord. Для генерации изображений используется команда /imagine, за которой следует описание желаемого изображения (промт). Кроме текста описания, вы можете добавлять параметры, влияющие на стилизацию, формат и другие аспекты результата.

Основные параметры и их значения

--ar (aspect ratio)

Устанавливает соотношение сторон изображения. Это важно, если вы хотите создать пейзаж или портрет.

Пример: –ar 16:9 для широкоформатного изображения.

Пример промта: "Закат над морем с лодкой на горизонте, в стиле акварели –ar 16:9".

--v (version)

Указывает версию модели MidJourney, которая будет использоваться для генерации изображения. Разные версии подходят для различных стилей и уровней детализации.

Пример: –v 6.1 для использования последней версии модели.

--s (stylization)

Определяет степень стилизации изображения. Чем выше значение, тем более художественным будет результат.

Диапазон: от 0 до 1000.

Пример: "Фантастический лес с неоновыми деревьями –s 750".

--seed

Используется для управления случайностью. Указание конкретного значения позволяет получать повторяемые результаты.

Пример: "Город будущего, в стиле киберпанк –seed 12345".

--chaos

Влияет на уровень случайности в начальных вариантах изображения. Высокие значения добавляют больше разнообразия.

Диапазон: от 0 до 100.

Пример: "Футуристический пейзаж с летающими машинами –chaos 80".

Вес ключевых слов (::)

Позволяет указать, какие элементы в промте имеют больший приоритет.

Пример: "Замок::2 в лесу::1 ночью".

Примеры эффективных промтов

Простой промт"Закат на берегу моря."

Нейросеть создаст базовый вариант без учёта стилистики или настроения.

Продвинутый промт с параметрами"Закат на берегу моря, где солнце отражается на воде, золотистые оттенки, акварельный стиль –ar 16:9 –s 800".

Это описание создаст изображение с чётко указанным стилем, композицией и атмосферой.

Смешивание стилей"Портрет женщины в футуристическом костюме, элементы киберпанка, яркие неоновые огни города –ar 9:16".

Подчёркивается как стиль, так и композиция.

Работа с вариациями и детализацией

После создания изображения MidJourney предлагает опции для работы с результатами:

U (Upscale): Улучшение выбранного варианта для повышения разрешения и детализации.

V (Variation): Создание вариаций на основе выбранного изображения.

Zoom: Расширение границ изображения для добавления новых деталей.

Полезные рекомендации

Используйте параметры для создания уникальных композиций. Например, "–chaos 70" подходит для экспериментов, а "–seed" помогает зафиксировать стиль.

Экспериментируйте с весами слов, чтобы расставить акценты.

Уточняйте стиль и настроение с помощью описаний, таких как "в стиле Ван Гога" или "минимализм".

Развитие навыков работы с параметрами и промтами позволяет вам полностью раскрыть возможности визуальных нейросетей и получать именно те изображения, которые соответствуют вашей задумке.

Работа с DALL-E: Создание уникальных изображений

DALL-E – это нейросеть, способная преобразовывать текстовые описания в изображения, используя естественный язык как основу для творчества. Она позволяет создавать уникальные визуальные концепции, смешивать неожиданные элементы и интерпретировать абстрактные идеи. Чтобы добиться качественного результата, важно правильно составлять запросы, которые точно передают ваше видение.

Как составлять описания для DALL-E?

Создание успешного промта для DALL-E включает несколько ключевых элементов:

Точное описание объекта

Начните с чёткого и понятного описания того, что вы хотите увидеть. Это может быть как конкретный объект, так и абстрактная идея. Например:

«Кот, летающий на ракете в космосе».

«Женщина в платье из листьев, танцующая в лесу».

Детализация сцены и элементов

Укажите, какие детали вы хотите включить. Это могут быть размеры, цвета, материалы или формы объектов. Пример:

«Красный двухэтажный автобус, стоящий на заснеженной улице Лондона».

«Портрет робота с человеческими глазами, выполненный в стиле сюрреализма».

Контекст и атмосфера

Опишите фон, время суток, освещение или настроение сцены. Это помогает нейросети создать изображение с нужной атмосферой. Например:

«Закат над океаном, яркие оранжевые и розовые тона».

«Парк ночью, освещённый лампами, с мягкими тенями от деревьев».

Стилистика

Уточните художественный стиль, если это важно. DALL-E поддерживает множество стилей: реализм, импрессионизм, минимализм, мультяшный стиль и многие другие. Пример:

«Пейзаж в стиле Ван Гога».

«Мультяшный город с забавными персонажами».

Примеры эффективных промтов

Простой промт

«Кот сидит на подоконнике и смотрит на падающий дождь».

Результат: реалистичный или слегка стилизованный образ кота и дождя.

Сложный промт с деталями

«Кот в шляпе детектива, сидящий за столом с увеличительным стеклом, освещённый мягким светом лампы, стиль нуар».

Результат: изображение с конкретными деталями и настроением.

Творческий промт с использованием необычных концепций

«Пейзаж с летающими островами, где растут гигантские грибы, в стиле фэнтези».

Результат: сказочная сцена с элементами магического реализма.

Указание стилистики и фона

«Чайный сервиз, стоящий на столе в английском саду, в стиле акварели».

Результат: лёгкое и утончённое изображение с акцентом на художественные детали.

Рекомендации по составлению запросов

Используйте ключевые слова

Ключевые слова, такие как «яркий», «минималистичный», «реалистичный», помогают настроить атмосферу и стилистику. Например: «Яркий портрет птицы, выполненный в минималистичном стиле».

Добавляйте контекст

Если вы хотите, чтобы DALL-E понимал, как объекты взаимодействуют друг с другом, уточняйте их расположение и действия. Пример: «Дерево, стоящее в центре пустыни, освещённое лунным светом».

Экспериментируйте

Смешивайте неожиданные элементы, чтобы создавать уникальные изображения. Например: «Гигантская улитка, путешествующая по улицам футуристического города».

Ограничивайте запросы, если нужно

Если результат оказывается слишком сложным, попробуйте упростить запрос и сосредоточиться на ключевых аспектах. Например: вместо «Слоны, танцующие в цирке под цветными огнями» используйте «Слон под цветными огнями, в стиле цирка».

DALL-E – мощный инструмент для визуального творчества, который предоставляет бесконечные возможности. Чем детальнее и яснее ваш промт, тем точнее результат. Освоив искусство составления запросов, вы сможете не только воплощать свои идеи в изображения, но и создавать уникальные художественные работы, которые будут вдохновлять.