Аренда GPU в России: гайд по провайдерам 2026
Аренда GPU в РФ — выбор между hourly bare-metal и pay-per-task managed-API. Разбираем актуальный рынок: Selectel, MWS, Hostkey, gpupool, Immers, цены и важные нюансы.
Обновлено: 2026-05-19
TL;DR
Рынок аренды GPU в России в 2026 — это bare-metal hourly (Selectel, MWS, Hostkey, Cloud4y, Immers.cloud), pay-per-task managed-API (gpupool и др.) и гибриды. RTX 4090 / A4000 в облаке начинаются от ~₽30-40k/мес. A100 80GB — от ~₽250-400k/мес. H100 — точечно, ~₽800k-1.5M/мес и waitlist. Выбор зависит от утилизации GPU, юридических требований и того, нужен ли вам root-доступ к серверу.
Что такое «аренда GPU» в России
Под этим в 2026 году обычно подразумевают одну из трёх моделей:
Bare-metal hourly — арендуете физическую машину с GPU, ставите свой Linux, всё под вашим контролем. Платите за время аренды (минимум — час, обычно — месяц). Подходит для R&D и стабильной нагрузки.
Pay-per-task managed-API — провайдер держит GPU, вы шлёте задачу через API (ComfyUI workflow, LLM-запрос, image-gen prompt) и платите за выполнение. Подходит для рваной нагрузки, агентств, SaaS.
Managed VM / GPU instance — облачные VM с GPU (как AWS EC2, но в РФ): Selectel Cloud GPU, MWS Cloud GPU, Yandex Cloud DataSphere. Платите hourly/per-second, но всё ещё нужен self-managed Linux и ML-стек.
Карта провайдеров (2026)
| Провайдер |
Модель |
GPU |
Особенности |
| Selectel |
bare-metal, cloud |
A100 80GB, H100, RTX A6000, L40S |
Корпоративный сегмент, ЦОД М9/М10, SLA, ФЗ-152 |
| MWS (МТС Cloud) |
bare-metal, cloud |
A100, H100 (waitlist), V100 |
Крупный игрок, ML-площадка с MLOps стеком |
| Hostkey |
bare-metal |
RTX 4090, A4000, A5000, A6000 |
Дешёвый bare-metal, удобный личный кабинет |
| Immers.cloud |
bare-metal |
RTX 4090, A100 |
Специализация на ML, есть готовые образы |
| Cloud4y |
cloud |
V100, RTX 4090 |
Средний бизнес, защита по ФЗ |
| ITGLOBAL.COM |
cloud |
A100, A40 |
Корпоративный сегмент, защищённые контуры |
| gpupool |
pay-per-task |
A100, RTX 4090 (через managed-API) |
ComfyUI/n8n как сервис, без аренды железа |
| Yandex Cloud DataSphere |
managed |
A100, V100 |
JupyterLab + распределённые тренинги |
| Sber Cloud Advanced |
cloud |
A100, V100 |
Привязка к Sber-экосистеме |
| GPUDC |
bare-metal |
RTX 3090, RTX 4090 |
Бюджетный сегмент |
Сколько это стоит (ориентиры на 2026)
Цены меняются, но порядок величин:
| GPU |
Bare-metal /мес (РФ) |
Bare-metal /час (РФ) |
Pay-per-task (managed) |
| RTX 4090 24GB |
₽30-50k |
₽120-180 |
₽1-2/image (SDXL) |
| RTX A4000 16GB |
₽25-40k |
₽80-130 |
- |
| RTX A5000 24GB |
₽40-60k |
₽160-220 |
- |
| RTX A6000 48GB |
₽70-110k |
₽250-380 |
- |
| A100 40GB |
₽180-260k |
₽550-900 |
через managed |
| A100 80GB |
₽250-400k |
₽800-1300 |
₽X/1000 LLM tokens |
| H100 80GB |
₽800k-1.5M (waitlist) |
₽2500-4500 |
очень точечно |
| L40S 48GB |
₽120-180k |
₽380-550 |
- |
«Pay-per-task» сильно зависит от типа задачи (SDXL/Flux/LLM/vision) — это не цена «за GPU», а за конкретный выполненный запрос.
Как выбрать модель аренды
Берите bare-metal hourly, если:
- Утилизация GPU > 40% (т.е. железо реально молотит большую часть суток).
- Нужен root-доступ, кастомные ядра, специфический setup.
- Регуляторика требует контроля над физическим контуром (ФЗ-152, ГОСТ).
- Стабильная нагрузка, прогнозируемый объём.
Берите managed-API / pay-per-task, если:
- Рваная нагрузка: пики и провалы, средняя утилизация < 30%.
- Не хотите управлять ML-инфраструктурой (vLLM, ComfyUI, CUDA-апдейты).
- Нужны эпизодически редкие GPU (H100 на пиковую задачу раз в неделю).
- Маленький стартап без DevOps-команды.
Гибрид:
- Hourly baseline (стабильный объём генерации) + pay-per-task для пиковой нагрузки.
- Это самая cost-efficient схема для среднего бизнеса 50-500 запросов в час.
Юридические аспекты для РФ
Если у вас B2B-клиенты в России, обратите внимание:
- ФЗ-152 (персональные данные) — данные граждан РФ должны храниться в РФ. Если в воркфлоу попадают ПДн (фото клиентов для аватаров, голоса для TTS) — берите провайдера с ЦОД в России (Selectel М9/М10, MWS, Cloud4y, gpupool).
- Аттестация по 17 приказу ФСТЭК — нужна для гос- и финсектора. У Selectel, MWS есть аттестованные сегменты, готовы дать копии аттестатов.
- Импортные ограничения — H100 / B100 поставляются в РФ по особым каналам. Это сказывается на цене и waitlist.
- NVIDIA EULA для GeForce — RTX 4090 (GeForce-серия) формально запрещены для datacenter-use. Большинство провайдеров игнорируют это, но юридически серая зона. Для тендерного бизнеса безопаснее A-серия (A5000/A6000) или Tesla (A40, A100).
- Лицензии моделей — Flux dev, LLaMA имеют commercial-clause. Часть managed-провайдеров покупают commercial license и включают в тариф; в bare-metal лицензия — ваша забота.
Как тестировать провайдера
Перед длинным контрактом полезно прогнать 1-2 дня тестовой нагрузки:
- Стабильность: запустить SDXL/Flux/LLM в цикле на 24 часа. Падений быть не должно. На bare-metal обращайте внимание на throttling (под нагрузкой температуры могут вылезать).
- Сеть: для managed-API замерьте latency до их endpoint из вашего региона. Из Москвы до Питера — обычно <10ms, до Урала — 30-50ms.
- Реальную скорость генерации: synthetic-бенчмарки бывают обманчивы. На SDXL замеряйте секунды на 1024×1024 с реальным workflow.
- Поддержку: задайте 1-2 нетривиальных вопроса в тикеты, посмотрите время ответа.
- Биллинг: для pay-per-task — попросите детализацию по 100 первых запросов, проверьте арифметику.
Типичные грабли
- Скрытый egress-трафик: некоторые облака платно тарифицируют исходящий трафик. Если генерите много изображений и отдаёте их на ваш CDN — посчитайте.
- «Бесплатный» storage: VPS обычно даёт 100-500 GB. Чекпойнты SD/Flux + датасеты быстро забивают это. Доп-storage часто стоит ощутимо.
- Заявленный vs реальный bandwidth: на bare-metal проверьте, что заявленные 1 Gbps реально 1 Gbps, а не 100 Mbps под нагрузкой.
- Дополнительные лицензии: некоторые провайдеры тарифицируют отдельно «коммерческое использование» открытых моделей.
- VAT/НДС: убедитесь, что в цене из лендинга НДС учтён (для юрлиц это влияет на TCO).
Что почитать дальше
Частые вопросы
Какой провайдер дешевле для RTX 4090?
Hostkey и Immers.cloud — bare-metal от ~₽30-40k/мес. Selectel/MWS — дороже из-за корпоративных требований. Pay-per-task (gpupool, Replicate) — дешевле для рваной нагрузки.
Есть ли в РФ A100 80GB в облаке?
Да, у Selectel, MWS, Cloud4y, ITGLOBAL. Цена ~₽250-400k/мес. Через managed-API часто можно платить per-second без долгосрочного контракта.
Можно ли арендовать H100 в России?
Сильно сложнее — официальные поставки ограничены. У Selectel и нескольких других есть, но waitlist и цена ~₽800k-1.5M/мес. Pay-per-task — точечно (gpupool, MWS) при наличии квот.
Pay-per-task или hourly — что выбрать?
Hourly выгоден при utilization > 40%. При рваной нагрузке (e-commerce, agencies, dev-tests) — pay-per-task. Часто комбинируют: hourly для baseline + pay-per-task для пиков.