Notebookcheck Logo
Сгенерированное искусственным интеллектом изображение мужчины в киберпанковской куртке с неоновым освещением, сидящего на диване в стильном клубе. Телевизор позади него гласит: "ГЕНЕРИРУЙТЕ ИЗОБРАЖЕНИЯ НА СВОЕМ КОМПЬЮТЕРЕ БЕСПЛАТНО" (Источник изображения: AI Generated)

Руководство: Вот как бесплатно генерировать изображения на Вашем ПК

CheckMag

Хотите создавать изображения на своем компьютере, не полагаясь на облачные сервисы? В этом руководстве Вы узнаете, как настроить бесплатные инструменты с открытым исходным кодом для полного творческого контроля без каких-либо подписок.
Rohith Bhaskar, Rohith Bhaskar (перевод Ninh Duy) Опубликовано 🇺🇸 🇵🇱 ...
AI Графич. процессоры Nvidia Open Source

Инструменты для создания изображений становятся все более способными создавать самые современные фотореалистичные изображения. К сожалению, большинство из них закрыты в сети за платной стеной, но что, если я скажу Вам, что есть способ запускать их локально с гораздо большей гибкостью, чем предоставляют онлайн-инструменты?

Необходимые условия

1) Графическая карта Nvidia с минимум 8 ГБ VRAM. (Рекомендуется RTX 3060 или лучше )

2) Не менее 16 Гб системной памяти DDR4. (Чем больше, тем лучше )

3) Windows 10/11 (необходима 64-разрядная ОС )

4) Не менее 100-150 Гб свободного места на жестком диске для установки всего и загрузки моделей.

5) Подключение к Интернету для первоначальной настройки. (Необходимо только для загрузки и установки фронтендов пользовательского интерфейса и моделей изображений )

Примечание: Графические процессоры AMD или Intel официально не поддерживаются большинством фронтендов пользовательского интерфейса и требуют обходных путей для работы.

Первое, что Вам нужно сделать, это убедиться, что Вы используете последние студийные драйверы Nvidia для Вашей видеокарты. Если Вы не уверены в том, какой графический процессор Nvidia у Вас установлен, щелкните правой кнопкой мыши в любом месте рабочего стола и выберите в контекстном меню пункт "Панель управления NVIDIA".

Экран контекстного меню правой кнопки мыши в Windows 11, в котором выделена панель управления Nvidia. (Источник изображения: Windows Screen Capture)
Нажмите на Панель управления Nvidia в контекстном меню. (Источник изображения: Захват экрана Windows)

Теперь найдите пункт "Информация о системе" в самом низу открывшейся страницы. Слева Вы должны увидеть название Вашей видеокарты, а также дополнительную информацию, если это необходимо.

Снимок экрана Панели управления Nvidia в Windows 11 с красным выделением Информации о системе внизу. (Источник изображения: Windows Screen Capture)
Найдите внизу Информацию о системе. (Источник изображения: Захват экрана Windows)
Снимок вкладки Nvidia "GPU" в разделе "Информация о системе" в Панели управления Nvidia в Windows 11. (Источник изображения: Windows Screen Capture)
Найдите название Вашего GPU слева. (Источник изображения: Захват экрана Windows)

Откройте официальный репозиторий драйверов Nvidia здесьнайдите в нем драйверы Nvidia Studio Drivers и нажмите на кнопку Download. Откроется страница, на которой Вы сможете загрузить последнюю версию драйвера. Теперь стоит проверить, поддерживается ли драйвер Вашим продуктом Nvidia. Вы можете сделать это, нажав на "Поддерживаемые продукты" чуть ниже кнопки загрузки. Установите драйверы и перезагрузите компьютер.

Примечание: При этом драйверы Game Ready Drivers будут перезаписаны, если они у Вас установлены. Если Ваша система предназначена в основном для игр, Вы можете заметить снижение производительности в играх.

Отлично! Первый шаг завершен. Теперь мы можем перейти к более интересным вещам, таким как загрузка фронтендов пользовательского интерфейса. Я настоятельно рекомендую загрузить и установить Stability Matrix. Это универсальный инструмент для обслуживания, который поддерживает несколько фронтендов пользовательского интерфейса и автоматически поддерживает их в актуальном состоянии. Он даже создает общие папки для моделей и результатов, которые Вы можете просматривать в одном месте.

На странице GitHubпрокрутите вниз до раздела readme и найдите Вашу операционную систему. Stability Matrix также предлагает загрузки для Linux и Mac. Для целей данного руководства мы будем использовать версию для Windows.

Снимок экрана страницы Stability Matrix на GitHub с выделенной кнопкой загрузки Windows 10/11. (Источник изображения: Захват экрана Windows)
Нажмите на кнопку Windows 10/11, чтобы скачать Stability Matrix. (Источник изображения: Захват экрана Windows)

Нажмите на кнопку операционной системы, и Вам будет предложено загрузить .zip-файл. Его следует поместить на диск, куда Вы хотите установить Stability Matrix. Убедитесь, что на диске есть не менее 100-150 ГБ свободного места. Это нужно не только для установки Stability Matrix, но и для загрузки необходимых моделей, текстовых кодировщиков и других системных файлов. Они очень быстро увеличиваются.

После того, как Вы скачали файл, распакуйте его и запустите StabilityMatrix.exe, расположенный в распакованной папке. Он автоматически загрузит все необходимые файлы и настроит для Вас интерфейс.

Потрясающе! Теперь у нас есть интерфейс для загрузки и установки нескольких фронтендов пользовательского интерфейса.

Теперь пришло время решить, какой фронт-энд Вы хотите использовать. Фронт-энд - это графический интерфейс пользователя (GUI), который позволяет Вам взаимодействовать с моделями изображений, манипулировать настройками и, что более важно, генерировать изображения.

Найдите внизу кнопку "Добавить пакет" и нажмите ее, чтобы открыть различные варианты.

Снимок экрана интерфейса Матрицы стабильности в Windows 11, с красным выделением кнопки пакетов. (Источник изображения: Windows Screen Capture)
Нажмите на значок "Пакеты" слева. (Источник изображения: Захват экрана Windows)
Снимок экрана интерфейса Матрицы стабильности в Windows 11, с красным выделением кнопки Добавить пакет. (Источник изображения: Захват экрана Windows)
Нажмите на кнопку Добавить пакет внизу. (Источник изображения: Захват экрана Windows)

Вот краткий список опций, предлагаемых в Stability Matrix.

1) Stable Diffusion WebUI Forge

2) Stable Diffusion WebUI Forge - Classic

3) ComfyUI (рекомендуется)

4) Foooocus

5) Fooocus - mashb1t's 1-Up Edition

6) Stable Diffusion WebUI

7) SwarmUI

8) Cogstudio

9) Stable Diffusion WebUI UX

10) RuinedFooocus

11) SD.Next

12) SDFX

13) InvokeAI

Лично я настоятельно рекомендую использовать ComfyUI. Это визуальное, основанное на узлах приложение, которое поначалу может показаться немного пугающим, но к нему удивительно легко привыкнуть. Помните, что Stability Matrix может управлять несколькими фронтендами, поэтому Вам не обязательно ограничиваться одним. Вы можете экспериментировать и найти тот, который подходит Вам больше всего.

Воспользуйтесь приведенным выше списком и перейдите на страницы GitHub для каждого пакета. Не торопитесь и узнайте больше о каждом пакете, прежде чем сделать выбор.

В рамках данного руководства я проведу Вас через загрузку и установку ComfyUI, а также нескольких полезных расширений, которые должны сослужить Вам хорошую службу.

Установка и настройка ComfyUI

Откройте Stability Matrix и нажмите на кнопку "Добавить пакет". Теперь найдите в списке предлагаемых пакетов "ComfyUI" и щелкните на нем. На открывшейся странице убедитесь, что в выпадающем окне выбрана версия "master". Версия "master" является наиболее стабильной и рекомендуется для большинства пользователей.

Снимок экрана хаба ComfyUI для установки в Stability Matrix, с красным выделением выпадающего меню выбора сборки. (Источник изображения: Windows Screen Capture)
Убедитесь, что в выпадающем меню выбран мастер. (Источник изображения: Захват экрана Windows)

Как только Вы нажмете кнопку Установить, Stability Matrix начнет загрузку пакета для Вас. Просто подождите, пока она завершится. Загрузка может занять несколько минут, поэтому не стесняйтесь продолжать пользоваться системой в это время. Если окно загрузки закроется или Вы случайно нажмете "Скрыть", воспользуйтесь кнопкой загрузки внизу, чтобы просмотреть статус Вашей текущей загрузки.

Снимок экрана интерфейса Stability Matrix с красным выделением кнопки загрузки. (Источник изображения: Захват экрана Windows)
Вы можете проверить текущие загрузки, нажав на эту кнопку. (Источник изображения: Захват экрана Windows)

После установки Вы должны увидеть всплывающее уведомление в системном трее, информирующее Вас о том, что ComfyUI готов к использованию.

Вернитесь в раздел "Пакеты", и Вы увидите на странице плитку ComfyUI, но пока не запускайте ее. По умолчанию ComfyUI запускается в режиме Normal VRAM для GPU с 12 ГБ VRAM или выше. Если у Вас карта с 8 Гб VRAM, сейчас самое время заставить Comfy запускаться в режиме Low VRAM.

Снимок экрана концентратора пакетов Stability Matrix с настройками, выделенными красным цветом на плитке ComfyUI. (Источник изображения: Захват экрана Windows)
Нажмите на значок настроек. (Источник изображения: Захват экрана Windows)

Нажмите на шестеренку настроек в центре и прокрутите вниз, чтобы найти раздел VRAM. Выберите "--lowvram" и нажмите Save.

Снимок экрана меню настроек в плитке ComfyUI на матрице стабильности с выделенным низким объемом памяти. (Источник изображения: Windows Screen Capture)
Выберите "--lowvram" и нажмите Сохранить. (Источник изображения: Захват экрана Windows)

Далее нам нужно установить ComfyUI Manager. Это важный компонент, который позволяет Вам устанавливать и управлять различными пользовательскими узлами в приложении. Нажмите на значок Jigsaw справа и введите "ComfyUI-Manager" в разделе "Доступные расширения". Выберите его и нажмите на кнопку Установить внизу. После завершения установки Вы должны увидеть рядом с ним "(установлено)". Теперь у нас все готово для запуска ComfyUI.

Снимок экрана, подчеркивающий значок лобзика в плитке ComfyUI на матрице стабильности. (Источник изображения: Захват экрана Windows)
Щелкните на значке лобзика, чтобы открыть меню расширений. (Источник изображения: Захват экрана Windows)
Снимок экрана меню Доступные расширения для ComfyUI в Stability Matrix. (Источник изображения: Windows Screen Capture)
Выберите ComfyUI-Manager и нажмите Установить. (Источник изображения: Снимок экрана Windows)

Запустите ComfyUI и позвольте ему выполнить процесс запуска. После этого он автоматически откроется в новой вкладке Вашего браузера по умолчанию. Если этого не произошло, вернитесь на вкладку "Пакеты" и нажмите на WebUI на плитке ComfyUI, которая теперь окрашена в зеленый цвет.

Снимок экрана зеленой плитки ComfyUI в Матрице стабильности с опцией WebUI, выделенной красным цветом. (Источник изображения: Windows Screen Capture)
Нажмите на кнопку WebUI, чтобы открыть интерфейс ComfyUI в Вашем браузере по умолчанию. (Источник изображения: Захват экрана Windows)

Поздравляем! Теперь Вы выполнили все предварительные требования. Теперь давайте перейдем к самому интересному - загрузке и использованию моделей изображений.

Загрузка и использование Вашей первой модели изображения

Прежде чем мы начнем загружать модели изображений, давайте пройдемся по глоссарию терминов, с которыми Вы должны быть знакомы.

1) UNET/Checkpoint/Diffusion Model/Diffusers - Большой босс. Мозг операции, думайте о нем как о художнике, который рисует, используя Ваши слова.

2) Токенизатор - Хранитель времени. Они преобразуют Ваши подсказки в лексемы для вставки, прежде чем за дело возьмутся кодировщики текста. В зависимости от модели, Вы будете ограничены определенным количеством лексем (слов), которые Вы можете использовать.

3) Кодировщики текста/CLIP - "тяжеловесы". Они преобразуют Ваши текстовые подсказки в цифровые данные, которые UNET может понять.

4) Сэмплеры - главный дирижер. Итеративно направляют процесс создания изображения, очищая его от шума и превращая в конечный результат.

5) VAE - команда уборщиков. Они убирают шум после этапа генерации и помогают улучшить качество изображения.

На своем пути Вы встретите еще много терминов, но это - основы, которые будут определять все с этого момента. Не стоит слишком беспокоиться о том, чтобы вдаваться в подробности.

Снимок экрана меню Workflow в ComfyUI с выделенным пунктом Browse Templates. (Источник изображения: Захват экрана Windows)
Выберите опцию Обзор шаблонов. (Источник изображения: Захват экрана Windows)

Запустите ComfyUI, и он должен открыть чистое окно рабочего процесса. Нажмите "Рабочий процесс" в левом верхнем углу, а затем "Обзор шаблонов"

Снимок экрана хаба Workflow в ComfyUI с выделенными Основами и Генерацией изображений. (Источник изображения: Windows Screen Capture)
Нажмите на Основы, а затем Генерация изображений. (Источник изображения: Захват экрана Windows)

Откроется окно с примерами рабочих процессов, уже настроенных для Вас. Нажмите на "Основы", а затем на "Генерация изображений" Вы сразу же увидите на экране ошибку, информирующую Вас об отсутствии моделей. Это происходит потому, что мы еще не загрузили модель изображения. Давайте сделаем это. Нажмите на кнопку "Загрузить".

Снимок экрана меню ошибок в ComfyUI с выделенной кнопкой Download. (Источник изображения: Windows Screen Capture)
Загрузите недостающую контрольную точку. (Источник изображения: Захват экрана Windows)

Пока файл загружается, давайте остановимся на некоторых различиях между разными моделями, которые Вы увидите. То, что мы сейчас загружаем, - это Stable Diffusion 1.5 базовая модель. На холсте ComfyUI Вы, возможно, заметили три отдельных соединения от самого первого узла "Load Checkpoint". По одному для MODEL, CLIP и VAE.

Крупный план узла Load Checkpoint в ComfyUI. (Источник изображения: Захват экрана Windows)
Все три выхода Load Checkpoint подключены к узлу рабочего процесса. (Источник изображения: Захват экрана Windows)

Это потому, что все три элемента включены в эту базовую контрольную точку, и Вам не нужно использовать отдельные CLIP и VAE для этой конкретной модели.

Однако более новые имиджевые модели, такие как Flux или HiDreamтребуют, чтобы Вы загружали их отдельно, так что имейте это в виду. К счастью, у них есть шаблоны примеров, как и у этой модели, так что Вам не придется беспокоиться о том, как все настроить. Давайте поговорим об этом позже. А пока давайте сгенерируем наше первое изображение.

Теперь, если Вы нажмете на кнопку Run в правом нижнем углу, Вы заметите, что ComfyUI все еще выдает Вам ошибку. Это потому, что модель должна быть помещена в правильную папку, чтобы Comfy смог ее распознать. Теперь перейдите в папку, в которую Вы загрузили модель, в File Explorer и скопируйте ее.

Вы заметите, что имя файла имеет расширение ".SAFETENSORS". Это формат, который использует файл. Как правило, скачивайте файлы только с расширением .safetensors. Не скачивайте тензоры pickle или .pth. Поверьте мне!

Откройте папку, в которую Вы установили Stability Matrix, и найдите папку под названием "Models" Дважды щелкните по ней и найдите подпапку под названием "StableDiffusion", вставьте в нее файл .safetensors.

Для дальнейшего использования. Модели с включенными CLIPS и VAE должны быть помещены в папку "StableDiffusion". Модели только с UNET (без CLIP и VAE) будут помещены в папку "DiffusionModels". Текстовые кодировщики (T5, Llama, CLIP L, CLIP G) необходимо поместить в папку "TextEncoders". Наконец, Ваши файлы VAE помещаются в папку "VAE".

Как Вы, вероятно, видите, папок гораздо больше, чем эти три. Я бы посоветовал разобраться с ними, когда Вы до них доберетесь. А пока давайте побеспокоимся о нашем изображении.

Крупный план выпадающего меню Load Checkpoint в ComfyUI. (Источник изображения: Захват экрана Windows)
Выберите "v1-5-pruned-emaonly-fp16" в выпадающем меню. (Источник изображения: Захват экрана Windows)

Обновите веб-страницу ComfyUI в Вашем браузере. Нажмите на диалоговое окно в узле "Load Checkpoint" и выберите загруженный файл.

Поскольку это шаблон, все уже готово для Вас. Тем не менее, стоит знать базовые основы для Ваших будущих рабочих процессов. Давайте начнем слева. Мы уже обсуждали узел "Load Checkpoint", а рядом с ним находятся два узла "CLIP Text Encode (Prompt)".

Верхний - это положительные подсказки или то, что Вы хотите видеть на изображении. Ниже - вход для негативных подсказок или того, что Вы не хотите видеть в конечном результате. Создание изображений - это баланс этих двух узлов вместе взятых. Вы создаете изображение, отмечаете, что Вам в нем не нравится, и вводите это в негативную подсказку. На данный момент они уже введены за нас, поэтому давайте нажмем "Выполнить"

ComfyUI - это визуальный интерфейс, то есть Вы можете видеть, как процесс происходит узел за узлом. Как только Ваш текст закодирован, он отправляется в "KSampler", который начинает итерацию изображения. Давайте быстро пройдемся по всем настройкам этого узла.

1) Seed: Считайте, что это адрес изображения. Тот же положительный сигнал + отрицательный сигнал + те же настройки + та же затравка = то же самое изображение. Полезно для воссоздания и итерации изображения.

2) Контроль после генерации: Определяет, будет ли семя рандомизироваться после каждого поколения или должно оставаться фиксированным.

3) Шаги: Количество шагов, в течение которых KSampler должен выполнять итерации. Большинство моделей поставляются с рекомендуемыми шагами.

4) CFG: Реакция модели на Ваши подсказки. Более высокие значения = строгое следование подсказкам, но меньшая креативность. Более низкие значения = более творческие результаты ценой соблюдения подсказок.

5) Sampler_name: название сэмплера, который Вы используете в данный момент. Нажмите на выпадающий список, чтобы получить больше вариантов. Поэкспериментируйте с различными настройками и сэмплерами для получения разнообразных результатов.

6) Планировщик: Считайте его вторым помощником, который придумывает стратегии, утверждаемые дирижером. Опять же, поэкспериментируйте с различными сэмплами и планировщиками, чтобы найти тот, который подойдет именно Вам.

7) Денуаз (Denoise): Определяет количество шума, добавляемого в начале процесса генерации. Он итеративно удаляется сэмплером. Значение не может быть установлено выше 1.00, а значения ниже этого (0.45 или 0.65) используются в основном в рабочих процессах "изображение-изображение", "рафинер" или "инпайнтинг".

Крупный план узла KSampler в ComfyUI. (Источник изображения: Захват экрана Windows)
Выход "latent_image" KSampler подключен к узлу "Empty Latent Image" в рабочем процессе. (Источник изображения: Захват экрана Windows)
Снимок экрана узла Empty Latent Image в ComfyUI. (Источник изображения: Windows Screen Capture)
Пустое скрытое изображение определяет размер Вашего конечного результата. (Источник изображения: Захват экрана Windows)

Вход latent_image, расположенный слева от узла KSampler, определяет размер Вашего изображения. В рабочем процессе он подключен к узлу "Empty Latent Image" с разрешением 512x512 и размером партии (количество изображений, создаваемых за один прогон) 1.

Пример изображения сгенерированной ИИ бутылки с галактикой внутри, стоящей на обычном деревянном столе. (Источник изображения: AI Generated)
Наше первое изображение с использованием настроек генерации. (Источник изображения: AI Generated)

А теперь посмотрите на это! Наше самое первое изображение. Если Вы дошли до этого момента, поздравляю! Теперь Вы знаете самые основы, которые помогут Вам начать путешествие по созданию изображений. Чем больше Вы будете экспериментировать, тем больше Вы откроете для себя, а эта кроличья нора очень глубока. Так что развлекайтесь.

Полезные ссылки

CivitAI: Ваш универсальный магазин для загрузки моделей, LoRA, вложений и многого другого. (Внимание: содержит NSFW-контент. Используйте встроенные фильтры сайта)

Monzon Media (Монзон Медиа): Фантастический ресурс для начинающих и продвинутых пользователей ComfyUI.

ComfyUI Wiki (Вики): Для всех Ваших потребностей в устранении неполадок.

Список ресурсов Bad ASS ComfyUI: Ссылки на все базовые МОДЕЛИ, КЛИПЫ и VAE, которые могут Вам понадобиться, в одном месте.

Comfy Workflows (Рабочие процессы): Специальное сообщество для обмена и загрузки рабочих процессов.

Этот важный материал точно понравится твоим друзьям в социальных сетях!
Mail Logo
> Обзоры Ноутбуков, Смартфонов, Планшетов. Тесты и Новости > Новости > Архив новостей > Архив новостей за 2025 год, 07 месяц > Руководство: Вот как бесплатно генерировать изображения на Вашем ПК
Rohith Bhaskar, 2025-07- 9 (Update: 2025-07- 9)