Документация: контракт API и жизненный цикл задачи
Документация gpupool построена вокруг жизненного цикла задачи: авторизация и управление API-ключами, создание задачи, статусы, отмена, ретраи, лимиты. Хранение результатов: сроки, форматы артефактов, доступ. Интеграция: webhook против опроса статуса, идемпотентность, коды ошибок. Полный контракт выдаётся участникам закрытого теста вместе с ключом.
Руководства и интеграции
- ComfyUI в n8n: запуск workflow из автоматизации — Подключаем ComfyUI к n8n через HTTP Request: готовый workflow, polling, обработка ошибок и пример с генерацией изображений по описанию.
- Stable Diffusion в n8n: генерация изображений через API — Подключаем Stable Diffusion к n8n: SDXL и Flux через REST, prompt-шаблоны в n8n, batch-генерация, сравнение self-hosted и managed-API.
- n8n AI Agent с GPU: vision, image-gen и custom-tools — AI Agent в n8n с GPU-tools: подключение vision-моделей, генерация изображений как tool call, embeddings и rerank через свой backend.
- ComfyUI API: документация и примеры — Полная документация ComfyUI API: endpoints /prompt, /history, /view, аутентификация, websocket-стриминг, типичные ошибки, примеры на Python и curl.
- CUDA out of memory в ComfyUI: что делать — Все способы устранить CUDA out of memory в ComfyUI: --lowvram, tiled VAE, разрешение, batch, очистка кэша, выбор GPU. С примерами и метриками VRAM.
- Flux в ComfyUI: полный гайд — Flux dev, schnell, pro в ComfyUI: установка моделей, базовый workflow, LoRA для Flux, использование через API. С метриками VRAM и скорости.
- SDXL API: документация и best practices — Документация SDXL API: параметры (cfg, steps, sampler), prompt engineering, negative prompts, seed control, image-to-image, цены.
- Flux API: dev, schnell, pro и где брать — Flux API от Black Forest Labs: модели dev/schnell/pro, выбор по задаче, параметры, стоимость, доступ в России и альтернативы.
- Аренда GPU в России: гайд по провайдерам 2026 — Где арендовать GPU в России: Selectel, MWS, Hostkey, Cloud4y, gpupool. Сравнение цен RTX 4090, A100, H100. Pay-per-task vs hourly.
- GPU для LLM: VRAM, квантизация, выбор — GPU для LLM inference и обучения: расчёт VRAM по параметрам, квантизация, выбор от 7B до 70B+ моделей.
- LLM API: какой брать в 2026 — Гайд по выбору LLM API: OpenAI vs Anthropic vs open-source (LLaMA, Qwen, Mistral) через managed-providers. Цены, latency, лицензии.
- vLLM как сервис: high-throughput LLM inference — vLLM — открытый inference engine для LLM с PagedAttention и continuous batching. Развёртывание, API, сравнение с TGI и TensorRT-LLM.
- CUDA out of memory: 15 способов починить — Полный гайд по устранению CUDA out of memory: PyTorch, gradient checkpointing, mixed precision, batch size, очистка кэша.
Как устроен запуск
- Получаете API-ключ после подключения к закрытому тесту.
- Отправляете POST с описанием задачи (например, ComfyUI workflow в JSON).
- Задача считается на GPU в отдельном контейнере.
- Результат приходит webhook-ом или забирается опросом статуса.
Что важно
- Оплата за выполнение — тарификация по времени работы задачи. Простой GPU не идёт в счёт.
- Изоляция — контейнер на каждую задачу. Память GPU и файлы клиентов не пересекаются.
- REST API — JSON, асинхронная модель (webhook или опрос статуса), идемпотентность по ID.
- Данные в России — понятная модель хранения и удаления результатов.
- ComfyUI и n8n — оба сценария поддержаны из коробки.
Как получить доступ
Сейчас сервис в закрытом тесте. Оставьте заявку через форму на странице — свяжемся, уточним задачу и подключим. Участникам теста выдаём бесплатные кредиты на первые задачи.