Flux в ComfyUI: полный гайд
Flux от Black Forest Labs — новая модель генерации, превосходящая SDXL по следованию промпту. Разбираем установку, workflow, выбор между dev/schnell/pro и использование через API.
Обновлено: 2026-05-19
TL;DR
Flux от Black Forest Labs — лучшая open-weights модель генерации изображений 2025-2026. Линейка из трёх версий: schnell (быстрая, Apache 2.0, 4 шага), dev (топ open, non-commercial license), pro (закрытая, только через BFL API). В ComfyUI работают schnell и dev — для pro нужен внешний API. Этот гайд: установка моделей, базовый workflow, выбор между fp16/fp8/GGUF, LoRA для Flux, и использование через managed-API.
Какой Flux выбрать
| Модель |
Лицензия |
VRAM (fp16) |
Шагов |
Скорость A100 80GB |
Случаи использования |
| Flux schnell |
Apache 2.0 |
24 GB |
4 |
~1.2 с/изображение |
Real-time UI, batch, A/B-тесты |
| Flux dev |
Non-commercial |
24 GB |
20-30 |
~5-8 с |
Рекламная графика, точные промпты |
| Flux pro |
BFL closed API |
- |
- |
- |
Самое высокое качество, через API only |
Ключевое для бизнеса: dev нельзя использовать коммерчески без commercial-лицензии BFL. На managed-API в РФ (gpupool, MWS) обычно лицензия уже куплена и включена в тариф. Self-host без лицензии — только R&D, не прод.
schnell — Apache 2.0, можно везде. Качество ~85% от dev, но в 5-7× быстрее.
Установка моделей в ComfyUI
Все файлы Flux раскиданы по нескольким каталогам:
ComfyUI/
├── models/
│ ├── unet/
│ │ ├── flux1-dev.safetensors # ~23.8 GB
│ │ └── flux1-schnell.safetensors # ~23.8 GB
│ ├── clip/
│ │ ├── t5xxl_fp16.safetensors # ~9.5 GB
│ │ └── clip_l.safetensors # ~246 MB
│ └── vae/
│ └── ae.safetensors # ~335 MB
Все модели — на HuggingFace black-forest-labs/FLUX.1-dev и black-forest-labs/FLUX.1-schnell. t5xxl и clip_l берутся у Stability AI или Comfy-Org.
Если VRAM мало — берите t5xxl_fp8_e4m3fn.safetensors вместо t5xxl_fp16 (вдвое меньше, разница в качестве минимальная).
Базовый workflow для Flux dev
В отличие от SDXL, Flux использует раздельные нагрузки UNet, CLIP и VAE. Базовый граф:
[Load Diffusion Model] flux1-dev.safetensors
[DualCLIPLoader] clip_l + t5xxl (type: flux)
[Load VAE] ae.safetensors
↓
[CLIPTextEncode] "photo of a red fox"
↓
[EmptyLatentImage] 1024×1024
↓
[KSampler] ← steps=20, cfg=1.0, sampler=euler, scheduler=simple
↓
[VAEDecode]
↓
[SaveImage]
Важные параметры для Flux dev:
cfg = 1.0 — Flux dev не использует classifier-free guidance в стандартном смысле. CFG > 1 даёт артефакты.
sampler = euler — рекомендованный. dpmpp_2m тоже работает.
scheduler = simple — официальный для Flux. beta иногда даёт лучшую детализацию.
steps = 20-30 — больше 30 редко имеет смысл.
Для Flux schnell:
cfg = 1.0 (то же)
steps = 4 (строго! больше — артефакты, меньше — низкое качество)
sampler = euler, scheduler = simple
fp8 версия — экономия VRAM
Flux dev/schnell в fp8 (flux1-dev-fp8.safetensors) — официальные fp8-веса от Comfy-Org. Модель занимает 12 GB вместо 24 GB, скорость почти та же, качество — практически идентично fp16.
Использование: в ноде Load Diffusion Model указываете flux1-dev-fp8.safetensors. Дополнительно для UNet можно включить fp8-вычисления: weight_dtype = fp8_e4m3fn в ноде.
На RTX 4090 (24 GB) fp16 еле умещается. fp8 даёт запас на ControlNet и LoRA.
GGUF — для 8-12 GB GPU
Полноценный fp16 Flux требует 24 GB. GGUF-квантизация позволяет запустить на меньшем железе:
| Квантизация |
Размер |
Качество |
Минимум VRAM |
| Q8_0 |
~12 GB |
Почти fp16 |
16 GB |
| Q6_K |
~10 GB |
Очень хорошо |
12 GB |
| Q5_K_M |
~8 GB |
Хорошо |
10 GB |
| Q4_K_S |
~6 GB |
Заметно хуже |
8 GB |
| Q3_K_S |
~5 GB |
Артефакты |
6 GB |
Установка:
ComfyUI-Manager → Install Custom Nodes → ComfyUI-GGUF.
- Скачать GGUF-файл с HuggingFace (city96 / Q-bert / другие репозитории).
- Положить в
ComfyUI/models/unet/.
- В workflow вместо
Load Diffusion Model использовать Unet Loader (GGUF).
T5 тоже можно квантизовать: t5-v1_1-xxl-encoder-gguf репо.
LoRA для Flux
Экосистема LoRA для Flux в 2026 уже большая, но меньше, чем для SDXL. Хорошие источники:
- CivitAI — фильтр по «Flux» базовой модели.
- HuggingFace — теги
flux-lora, text-to-image.
- AI-Toolkit — для собственного обучения.
В workflow LoRA подключается стандартно через LoraLoader после Load Diffusion Model. Веса (strength_model) обычно 0.6–1.0.
Важно: LoRA, обученные для SDXL, не работают с Flux (другая архитектура). Берите только Flux-specific.
Использование Flux через managed-API
Self-host Flux требует серьёзного железа: минимум RTX 4090 (24 GB) или A5000. Для большинства команд проще управлять через API.
gpupool, fal.ai, Replicate
# fal.ai (пример эндпоинта)
curl -X POST https://fal.run/fal-ai/flux/dev \
-H "Authorization: Key $FAL_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "professional product photo of a red sneaker on white background",
"image_size": "square_hd",
"num_inference_steps": 28,
"guidance_scale": 3.5
}'
Ответ — URL с PNG на CDN. Цена за изображение Flux dev: $0.025 (fal.ai), $0.04 (Replicate). Для российской аудитории gpupool и Hostkey предлагают похожие тарифы в рублях.
Через ComfyUI workflow + managed-API
В managed-API gpupool вы загружаете полный ComfyUI workflow JSON через POST /v1/comfyui/run. Это даёт максимум контроля (custom LoRA, многоступенчатые графы), при этом GPU держит провайдер.
Типичные проблемы
| Симптом |
Причина |
Решение |
| Чёрные изображения |
Неправильный VAE или scheduler не «simple» |
Проверить VAE = ae.safetensors. Scheduler = simple или beta. |
Артефакты при cfg > 1 |
Flux dev не поддерживает classical CFG |
cfg = 1.0. Сила промпта регулируется через guidance_scale (в Flux Guidance node) |
| OOM при стандартной нагрузке |
fp16 Flux требует 24 GB |
Перейти на fp8 или GGUF |
| Очень медленно (60+ с на 1024×1024) |
На CPU/old GPU без оптимизаций |
Включить --fp8_e4m3fn и xformers |
| Артефакты на Flux schnell |
steps != 4 |
Установить ровно 4 шага |
| LoRA не работает |
Неправильная архитектура (SDXL LoRA) |
Скачать Flux-specific LoRA |
Сравнение Flux vs SDXL
| Признак |
SDXL 1.0 |
Flux dev |
| Размер модели |
~6.5 GB |
~23.8 GB |
| Минимум VRAM |
6-8 GB (с тюнингом) |
24 GB fp16 / 8 GB GGUF |
| Следование промпту |
Хорошее |
Превосходное |
| Текст на изображении |
Плохо |
Очень хорошо |
| Лица |
Хорошо |
Очень хорошо |
| Экосистема LoRA |
Огромная |
Растущая |
| Скорость A100 (1024×1024) |
~1.8 с (30 steps) |
~5-8 с (28 steps) |
| Лицензия |
OpenRAIL (коммерчески ОК) |
Non-commercial (нужна commercial) |
| Цена через managed-API |
₽1-2/img |
₽4-8/img |
Когда брать SDXL: батчи 10k+ изображений в день, нужна большая база LoRA-стилей, нет 24 GB VRAM, бюджет важнее качества.
Когда брать Flux: рекламная графика, важен текст на изображении, нужно точное следование сложным промптам, бюджет позволяет.
Что почитать дальше
Частые вопросы
Какая модель Flux лучше?
Flux pro — топ по качеству, но closed source через BFL API. Flux dev — лучшая open source модель, требует ~24 GB VRAM. Flux schnell — быстрая (4 шага), Apache 2.0, для production.
Сколько VRAM нужно для Flux?
Flux dev fp16: 24 GB (RTX 4090, A5000). Flux dev fp8: 16-20 GB. Flux schnell: те же требования + меньше шагов. Меньше 16 GB — нужны квантизованные версии (GGUF Q4/Q5).
Работают ли LoRA для SDXL с Flux?
Нет, архитектура разная. LoRA нужны специально для Flux. Их уже много на CivitAI, но экосистема пока меньше SDXL.
Какие шаги (steps) выставлять?
Flux dev: 20-30 (евро/karras scheduler). Flux schnell: 4 (только! больше — артефакты). Sampler — flowmatch или dpmpp_2m.