
Руководство: Вот как бесплатно генерировать изображения на Вашем ПК
CheckMag
Хотите создавать изображения на своем компьютере, не полагаясь на облачные сервисы? В этом руководстве Вы узнаете, как настроить бесплатные инструменты с открытым исходным кодом для полного творческого контроля без каких-либо подписок.Rohith Bhaskar, ✓ Rohith Bhaskar (перевод Ninh Duy) Опубликовано 🇺🇸 🇵🇱 ...
Инструменты для создания изображений становятся все более способными создавать самые современные фотореалистичные изображения. К сожалению, большинство из них закрыты в сети за платной стеной, но что, если я скажу Вам, что есть способ запускать их локально с гораздо большей гибкостью, чем предоставляют онлайн-инструменты?
Необходимые условия
1) Графическая карта Nvidia с минимум 8 ГБ VRAM. (Рекомендуется RTX 3060 или лучше )
2) Не менее 16 Гб системной памяти DDR4. (Чем больше, тем лучше )
3) Windows 10/11 (необходима 64-разрядная ОС )
4) Не менее 100-150 Гб свободного места на жестком диске для установки всего и загрузки моделей.
5) Подключение к Интернету для первоначальной настройки. (Необходимо только для загрузки и установки фронтендов пользовательского интерфейса и моделей изображений )
Примечание: Графические процессоры AMD или Intel официально не поддерживаются большинством фронтендов пользовательского интерфейса и требуют обходных путей для работы.
Первое, что Вам нужно сделать, это убедиться, что Вы используете последние студийные драйверы Nvidia для Вашей видеокарты. Если Вы не уверены в том, какой графический процессор Nvidia у Вас установлен, щелкните правой кнопкой мыши в любом месте рабочего стола и выберите в контекстном меню пункт "Панель управления NVIDIA".
Теперь найдите пункт "Информация о системе" в самом низу открывшейся страницы. Слева Вы должны увидеть название Вашей видеокарты, а также дополнительную информацию, если это необходимо.
Откройте официальный репозиторий драйверов Nvidia здесьнайдите в нем драйверы Nvidia Studio Drivers и нажмите на кнопку Download. Откроется страница, на которой Вы сможете загрузить последнюю версию драйвера. Теперь стоит проверить, поддерживается ли драйвер Вашим продуктом Nvidia. Вы можете сделать это, нажав на "Поддерживаемые продукты" чуть ниже кнопки загрузки. Установите драйверы и перезагрузите компьютер.
Примечание: При этом драйверы Game Ready Drivers будут перезаписаны, если они у Вас установлены. Если Ваша система предназначена в основном для игр, Вы можете заметить снижение производительности в играх.
Отлично! Первый шаг завершен. Теперь мы можем перейти к более интересным вещам, таким как загрузка фронтендов пользовательского интерфейса. Я настоятельно рекомендую загрузить и установить Stability Matrix. Это универсальный инструмент для обслуживания, который поддерживает несколько фронтендов пользовательского интерфейса и автоматически поддерживает их в актуальном состоянии. Он даже создает общие папки для моделей и результатов, которые Вы можете просматривать в одном месте.
На странице GitHubпрокрутите вниз до раздела readme и найдите Вашу операционную систему. Stability Matrix также предлагает загрузки для Linux и Mac. Для целей данного руководства мы будем использовать версию для Windows.
Нажмите на кнопку операционной системы, и Вам будет предложено загрузить .zip-файл. Его следует поместить на диск, куда Вы хотите установить Stability Matrix. Убедитесь, что на диске есть не менее 100-150 ГБ свободного места. Это нужно не только для установки Stability Matrix, но и для загрузки необходимых моделей, текстовых кодировщиков и других системных файлов. Они очень быстро увеличиваются.
После того, как Вы скачали файл, распакуйте его и запустите StabilityMatrix.exe, расположенный в распакованной папке. Он автоматически загрузит все необходимые файлы и настроит для Вас интерфейс.
Потрясающе! Теперь у нас есть интерфейс для загрузки и установки нескольких фронтендов пользовательского интерфейса.
Теперь пришло время решить, какой фронт-энд Вы хотите использовать. Фронт-энд - это графический интерфейс пользователя (GUI), который позволяет Вам взаимодействовать с моделями изображений, манипулировать настройками и, что более важно, генерировать изображения.
Вот краткий список опций, предлагаемых в Stability Matrix.
1) Stable Diffusion WebUI Forge
2) Stable Diffusion WebUI Forge - Classic
4) Foooocus
5) Fooocus - mashb1t's 1-Up Edition
7) SwarmUI
8) Cogstudio
10) RuinedFooocus
11) SD.Next
12) SDFX
13) InvokeAI
Лично я настоятельно рекомендую использовать ComfyUI. Это визуальное, основанное на узлах приложение, которое поначалу может показаться немного пугающим, но к нему удивительно легко привыкнуть. Помните, что Stability Matrix может управлять несколькими фронтендами, поэтому Вам не обязательно ограничиваться одним. Вы можете экспериментировать и найти тот, который подходит Вам больше всего.
Воспользуйтесь приведенным выше списком и перейдите на страницы GitHub для каждого пакета. Не торопитесь и узнайте больше о каждом пакете, прежде чем сделать выбор.
В рамках данного руководства я проведу Вас через загрузку и установку ComfyUI, а также нескольких полезных расширений, которые должны сослужить Вам хорошую службу.
Установка и настройка ComfyUI
Откройте Stability Matrix и нажмите на кнопку "Добавить пакет". Теперь найдите в списке предлагаемых пакетов "ComfyUI" и щелкните на нем. На открывшейся странице убедитесь, что в выпадающем окне выбрана версия "master". Версия "master" является наиболее стабильной и рекомендуется для большинства пользователей.
Как только Вы нажмете кнопку Установить, Stability Matrix начнет загрузку пакета для Вас. Просто подождите, пока она завершится. Загрузка может занять несколько минут, поэтому не стесняйтесь продолжать пользоваться системой в это время. Если окно загрузки закроется или Вы случайно нажмете "Скрыть", воспользуйтесь кнопкой загрузки внизу, чтобы просмотреть статус Вашей текущей загрузки.
После установки Вы должны увидеть всплывающее уведомление в системном трее, информирующее Вас о том, что ComfyUI готов к использованию.
Вернитесь в раздел "Пакеты", и Вы увидите на странице плитку ComfyUI, но пока не запускайте ее. По умолчанию ComfyUI запускается в режиме Normal VRAM для GPU с 12 ГБ VRAM или выше. Если у Вас карта с 8 Гб VRAM, сейчас самое время заставить Comfy запускаться в режиме Low VRAM.
Далее нам нужно установить ComfyUI Manager. Это важный компонент, который позволяет Вам устанавливать и управлять различными пользовательскими узлами в приложении. Нажмите на значок Jigsaw справа и введите "ComfyUI-Manager" в разделе "Доступные расширения". Выберите его и нажмите на кнопку Установить внизу. После завершения установки Вы должны увидеть рядом с ним "(установлено)". Теперь у нас все готово для запуска ComfyUI.
Запустите ComfyUI и позвольте ему выполнить процесс запуска. После этого он автоматически откроется в новой вкладке Вашего браузера по умолчанию. Если этого не произошло, вернитесь на вкладку "Пакеты" и нажмите на WebUI на плитке ComfyUI, которая теперь окрашена в зеленый цвет.
Поздравляем! Теперь Вы выполнили все предварительные требования. Теперь давайте перейдем к самому интересному - загрузке и использованию моделей изображений.
Загрузка и использование Вашей первой модели изображения
Прежде чем мы начнем загружать модели изображений, давайте пройдемся по глоссарию терминов, с которыми Вы должны быть знакомы.
1) UNET/Checkpoint/Diffusion Model/Diffusers - Большой босс. Мозг операции, думайте о нем как о художнике, который рисует, используя Ваши слова.
2) Токенизатор - Хранитель времени. Они преобразуют Ваши подсказки в лексемы для вставки, прежде чем за дело возьмутся кодировщики текста. В зависимости от модели, Вы будете ограничены определенным количеством лексем (слов), которые Вы можете использовать.
3) Кодировщики текста/CLIP - "тяжеловесы". Они преобразуют Ваши текстовые подсказки в цифровые данные, которые UNET может понять.
4) Сэмплеры - главный дирижер. Итеративно направляют процесс создания изображения, очищая его от шума и превращая в конечный результат.
5) VAE - команда уборщиков. Они убирают шум после этапа генерации и помогают улучшить качество изображения.
На своем пути Вы встретите еще много терминов, но это - основы, которые будут определять все с этого момента. Не стоит слишком беспокоиться о том, чтобы вдаваться в подробности.
Откроется окно с примерами рабочих процессов, уже настроенных для Вас. Нажмите на "Основы", а затем на "Генерация изображений" Вы сразу же увидите на экране ошибку, информирующую Вас об отсутствии моделей. Это происходит потому, что мы еще не загрузили модель изображения. Давайте сделаем это. Нажмите на кнопку "Загрузить".
Пока файл загружается, давайте остановимся на некоторых различиях между разными моделями, которые Вы увидите. То, что мы сейчас загружаем, - это Stable Diffusion 1.5 базовая модель. На холсте ComfyUI Вы, возможно, заметили три отдельных соединения от самого первого узла "Load Checkpoint". По одному для MODEL, CLIP и VAE.
Это потому, что все три элемента включены в эту базовую контрольную точку, и Вам не нужно использовать отдельные CLIP и VAE для этой конкретной модели.
Однако более новые имиджевые модели, такие как Flux или HiDreamтребуют, чтобы Вы загружали их отдельно, так что имейте это в виду. К счастью, у них есть шаблоны примеров, как и у этой модели, так что Вам не придется беспокоиться о том, как все настроить. Давайте поговорим об этом позже. А пока давайте сгенерируем наше первое изображение.
Теперь, если Вы нажмете на кнопку Run в правом нижнем углу, Вы заметите, что ComfyUI все еще выдает Вам ошибку. Это потому, что модель должна быть помещена в правильную папку, чтобы Comfy смог ее распознать. Теперь перейдите в папку, в которую Вы загрузили модель, в File Explorer и скопируйте ее.
Вы заметите, что имя файла имеет расширение ".SAFETENSORS". Это формат, который использует файл. Как правило, скачивайте файлы только с расширением .safetensors. Не скачивайте тензоры pickle или .pth. Поверьте мне!
Откройте папку, в которую Вы установили Stability Matrix, и найдите папку под названием "Models" Дважды щелкните по ней и найдите подпапку под названием "StableDiffusion", вставьте в нее файл .safetensors.
Для дальнейшего использования. Модели с включенными CLIPS и VAE должны быть помещены в папку "StableDiffusion". Модели только с UNET (без CLIP и VAE) будут помещены в папку "DiffusionModels". Текстовые кодировщики (T5, Llama, CLIP L, CLIP G) необходимо поместить в папку "TextEncoders". Наконец, Ваши файлы VAE помещаются в папку "VAE".
Как Вы, вероятно, видите, папок гораздо больше, чем эти три. Я бы посоветовал разобраться с ними, когда Вы до них доберетесь. А пока давайте побеспокоимся о нашем изображении.
Обновите веб-страницу ComfyUI в Вашем браузере. Нажмите на диалоговое окно в узле "Load Checkpoint" и выберите загруженный файл.
Поскольку это шаблон, все уже готово для Вас. Тем не менее, стоит знать базовые основы для Ваших будущих рабочих процессов. Давайте начнем слева. Мы уже обсуждали узел "Load Checkpoint", а рядом с ним находятся два узла "CLIP Text Encode (Prompt)".
Верхний - это положительные подсказки или то, что Вы хотите видеть на изображении. Ниже - вход для негативных подсказок или того, что Вы не хотите видеть в конечном результате. Создание изображений - это баланс этих двух узлов вместе взятых. Вы создаете изображение, отмечаете, что Вам в нем не нравится, и вводите это в негативную подсказку. На данный момент они уже введены за нас, поэтому давайте нажмем "Выполнить"
ComfyUI - это визуальный интерфейс, то есть Вы можете видеть, как процесс происходит узел за узлом. Как только Ваш текст закодирован, он отправляется в "KSampler", который начинает итерацию изображения. Давайте быстро пройдемся по всем настройкам этого узла.
1) Seed: Считайте, что это адрес изображения. Тот же положительный сигнал + отрицательный сигнал + те же настройки + та же затравка = то же самое изображение. Полезно для воссоздания и итерации изображения.
2) Контроль после генерации: Определяет, будет ли семя рандомизироваться после каждого поколения или должно оставаться фиксированным.
3) Шаги: Количество шагов, в течение которых KSampler должен выполнять итерации. Большинство моделей поставляются с рекомендуемыми шагами.
4) CFG: Реакция модели на Ваши подсказки. Более высокие значения = строгое следование подсказкам, но меньшая креативность. Более низкие значения = более творческие результаты ценой соблюдения подсказок.
5) Sampler_name: название сэмплера, который Вы используете в данный момент. Нажмите на выпадающий список, чтобы получить больше вариантов. Поэкспериментируйте с различными настройками и сэмплерами для получения разнообразных результатов.
6) Планировщик: Считайте его вторым помощником, который придумывает стратегии, утверждаемые дирижером. Опять же, поэкспериментируйте с различными сэмплами и планировщиками, чтобы найти тот, который подойдет именно Вам.
7) Денуаз (Denoise): Определяет количество шума, добавляемого в начале процесса генерации. Он итеративно удаляется сэмплером. Значение не может быть установлено выше 1.00, а значения ниже этого (0.45 или 0.65) используются в основном в рабочих процессах "изображение-изображение", "рафинер" или "инпайнтинг".
Вход latent_image, расположенный слева от узла KSampler, определяет размер Вашего изображения. В рабочем процессе он подключен к узлу "Empty Latent Image" с разрешением 512x512 и размером партии (количество изображений, создаваемых за один прогон) 1.
А теперь посмотрите на это! Наше самое первое изображение. Если Вы дошли до этого момента, поздравляю! Теперь Вы знаете самые основы, которые помогут Вам начать путешествие по созданию изображений. Чем больше Вы будете экспериментировать, тем больше Вы откроете для себя, а эта кроличья нора очень глубока. Так что развлекайтесь.
Полезные ссылки
CivitAI: Ваш универсальный магазин для загрузки моделей, LoRA, вложений и многого другого. (Внимание: содержит NSFW-контент. Используйте встроенные фильтры сайта)
Monzon Media (Монзон Медиа): Фантастический ресурс для начинающих и продвинутых пользователей ComfyUI.
ComfyUI Wiki (Вики): Для всех Ваших потребностей в устранении неполадок.
Список ресурсов Bad ASS ComfyUI: Ссылки на все базовые МОДЕЛИ, КЛИПЫ и VAE, которые могут Вам понадобиться, в одном месте.
Comfy Workflows (Рабочие процессы): Специальное сообщество для обмена и загрузки рабочих процессов.