Flux в ComfyUI: полный гайд

Flux от Black Forest Labs — новая модель генерации, превосходящая SDXL по следованию промпту. Разбираем установку, workflow, выбор между dev/schnell/pro и использование через API.

Обновлено: 2026-05-19

TL;DR

Flux от Black Forest Labs — лучшая open-weights модель генерации изображений 2025-2026. Линейка из трёх версий: schnell (быстрая, Apache 2.0, 4 шага), dev (топ open, non-commercial license), pro (закрытая, только через BFL API). В ComfyUI работают schnell и dev — для pro нужен внешний API. Этот гайд: установка моделей, базовый workflow, выбор между fp16/fp8/GGUF, LoRA для Flux, и использование через managed-API.

Какой Flux выбрать

Модель	Лицензия	VRAM (fp16)	Шагов	Скорость A100 80GB	Случаи использования
Flux schnell	Apache 2.0	24 GB	4	~1.2 с/изображение	Real-time UI, batch, A/B-тесты
Flux dev	Non-commercial	24 GB	20-30	~5-8 с	Рекламная графика, точные промпты
Flux pro	BFL closed API	-	-	-	Самое высокое качество, через API only

Ключевое для бизнеса: dev нельзя использовать коммерчески без commercial-лицензии BFL. На managed-API в РФ (gpupool, MWS) обычно лицензия уже куплена и включена в тариф. Self-host без лицензии — только R&D, не прод.

schnell — Apache 2.0, можно везде. Качество ~85% от dev, но в 5-7× быстрее.

Установка моделей в ComfyUI

Все файлы Flux раскиданы по нескольким каталогам:

ComfyUI/
├── models/
│   ├── unet/
│   │   ├── flux1-dev.safetensors          # ~23.8 GB
│   │   └── flux1-schnell.safetensors      # ~23.8 GB
│   ├── clip/
│   │   ├── t5xxl_fp16.safetensors         # ~9.5 GB
│   │   └── clip_l.safetensors             # ~246 MB
│   └── vae/
│       └── ae.safetensors                  # ~335 MB

Все модели — на HuggingFace black-forest-labs/FLUX.1-dev и black-forest-labs/FLUX.1-schnell. t5xxl и clip_l берутся у Stability AI или Comfy-Org.

Если VRAM мало — берите t5xxl_fp8_e4m3fn.safetensors вместо t5xxl_fp16 (вдвое меньше, разница в качестве минимальная).

Базовый workflow для Flux dev

В отличие от SDXL, Flux использует раздельные нагрузки UNet, CLIP и VAE. Базовый граф:

[Load Diffusion Model] flux1-dev.safetensors
[DualCLIPLoader] clip_l + t5xxl   (type: flux)
[Load VAE] ae.safetensors
        ↓
[CLIPTextEncode] "photo of a red fox"
        ↓
[EmptyLatentImage] 1024×1024
        ↓
[KSampler]                ← steps=20, cfg=1.0, sampler=euler, scheduler=simple
        ↓
[VAEDecode]
        ↓
[SaveImage]

Важные параметры для Flux dev:

cfg = 1.0 — Flux dev не использует classifier-free guidance в стандартном смысле. CFG > 1 даёт артефакты.
sampler = euler — рекомендованный. dpmpp_2m тоже работает.
scheduler = simple — официальный для Flux. beta иногда даёт лучшую детализацию.
steps = 20-30 — больше 30 редко имеет смысл.

Для Flux schnell:

cfg = 1.0 (то же)
steps = 4 (строго! больше — артефакты, меньше — низкое качество)
sampler = euler, scheduler = simple

fp8 версия — экономия VRAM

Flux dev/schnell в fp8 (flux1-dev-fp8.safetensors) — официальные fp8-веса от Comfy-Org. Модель занимает 12 GB вместо 24 GB, скорость почти та же, качество — практически идентично fp16.

Использование: в ноде Load Diffusion Model указываете flux1-dev-fp8.safetensors. Дополнительно для UNet можно включить fp8-вычисления: weight_dtype = fp8_e4m3fn в ноде.

На RTX 4090 (24 GB) fp16 еле умещается. fp8 даёт запас на ControlNet и LoRA.

GGUF — для 8-12 GB GPU

Полноценный fp16 Flux требует 24 GB. GGUF-квантизация позволяет запустить на меньшем железе:

Квантизация	Размер	Качество	Минимум VRAM
Q8_0	~12 GB	Почти fp16	16 GB
Q6_K	~10 GB	Очень хорошо	12 GB
Q5_K_M	~8 GB	Хорошо	10 GB
Q4_K_S	~6 GB	Заметно хуже	8 GB
Q3_K_S	~5 GB	Артефакты	6 GB

Установка:

ComfyUI-Manager → Install Custom Nodes → ComfyUI-GGUF.
Скачать GGUF-файл с HuggingFace (city96 / Q-bert / другие репозитории).
Положить в ComfyUI/models/unet/.
В workflow вместо Load Diffusion Model использовать Unet Loader (GGUF).

T5 тоже можно квантизовать: t5-v1_1-xxl-encoder-gguf репо.

LoRA для Flux

Экосистема LoRA для Flux в 2026 уже большая, но меньше, чем для SDXL. Хорошие источники:

CivitAI — фильтр по «Flux» базовой модели.
HuggingFace — теги flux-lora, text-to-image.
AI-Toolkit — для собственного обучения.

В workflow LoRA подключается стандартно через LoraLoader после Load Diffusion Model. Веса (strength_model) обычно 0.6–1.0.

Важно: LoRA, обученные для SDXL, не работают с Flux (другая архитектура). Берите только Flux-specific.

Использование Flux через managed-API

Self-host Flux требует серьёзного железа: минимум RTX 4090 (24 GB) или A5000. Для большинства команд проще управлять через API.

gpupool, fal.ai, Replicate

# fal.ai (пример эндпоинта)
curl -X POST https://fal.run/fal-ai/flux/dev \
  -H "Authorization: Key $FAL_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "professional product photo of a red sneaker on white background",
    "image_size": "square_hd",
    "num_inference_steps": 28,
    "guidance_scale": 3.5
  }'

Ответ — URL с PNG на CDN. Цена за изображение Flux dev: $0.025 (fal.ai), $0.04 (Replicate). Для российской аудитории gpupool и Hostkey предлагают похожие тарифы в рублях.

Через ComfyUI workflow + managed-API

В managed-API gpupool вы загружаете полный ComfyUI workflow JSON через POST /v1/comfyui/run. Это даёт максимум контроля (custom LoRA, многоступенчатые графы), при этом GPU держит провайдер.

Типичные проблемы

Симптом	Причина	Решение
Чёрные изображения	Неправильный VAE или scheduler не «simple»	Проверить VAE = ae.safetensors. Scheduler = simple или beta.
Артефакты при `cfg > 1`	Flux dev не поддерживает classical CFG	`cfg = 1.0`. Сила промпта регулируется через `guidance_scale` (в Flux Guidance node)
OOM при стандартной нагрузке	fp16 Flux требует 24 GB	Перейти на fp8 или GGUF
Очень медленно (60+ с на 1024×1024)	На CPU/old GPU без оптимизаций	Включить `--fp8_e4m3fn` и `xformers`
Артефакты на Flux schnell	steps != 4	Установить ровно 4 шага
LoRA не работает	Неправильная архитектура (SDXL LoRA)	Скачать Flux-specific LoRA

Сравнение Flux vs SDXL

Признак	SDXL 1.0	Flux dev
Размер модели	~6.5 GB	~23.8 GB
Минимум VRAM	6-8 GB (с тюнингом)	24 GB fp16 / 8 GB GGUF
Следование промпту	Хорошее	Превосходное
Текст на изображении	Плохо	Очень хорошо
Лица	Хорошо	Очень хорошо
Экосистема LoRA	Огромная	Растущая
Скорость A100 (1024×1024)	~1.8 с (30 steps)	~5-8 с (28 steps)
Лицензия	OpenRAIL (коммерчески ОК)	Non-commercial (нужна commercial)
Цена через managed-API	₽1-2/img	₽4-8/img

Когда брать SDXL: батчи 10k+ изображений в день, нужна большая база LoRA-стилей, нет 24 GB VRAM, бюджет важнее качества.

Когда брать Flux: рекламная графика, важен текст на изображении, нужно точное следование сложным промптам, бюджет позволяет.

Что почитать дальше

Flux API: dev vs schnell vs pro — выбор модели через managed-API.
Flux dev vs schnell vs pro — детальное сравнение трёх версий.
CUDA out of memory в ComfyUI — критично для Flux на ограниченном железе.
ComfyUI API — общий гайд по API ComfyUI.
GPU для Stable Diffusion — какие GPU подходят под Flux.

Частые вопросы

Какая модель Flux лучше?

Flux pro — топ по качеству, но closed source через BFL API. Flux dev — лучшая open source модель, требует ~24 GB VRAM. Flux schnell — быстрая (4 шага), Apache 2.0, для production.

Сколько VRAM нужно для Flux?

Flux dev fp16: 24 GB (RTX 4090, A5000). Flux dev fp8: 16-20 GB. Flux schnell: те же требования + меньше шагов. Меньше 16 GB — нужны квантизованные версии (GGUF Q4/Q5).

Работают ли LoRA для SDXL с Flux?

Нет, архитектура разная. LoRA нужны специально для Flux. Их уже много на CivitAI, но экосистема пока меньше SDXL.

Какие шаги (steps) выставлять?

Flux dev: 20-30 (евро/karras scheduler). Flux schnell: 4 (только! больше — артефакты). Sampler — flowmatch или dpmpp_2m.