Аренда GPU в России: гайд по провайдерам 2026

Q: Какой провайдер дешевле для RTX 4090?

Hostkey и Immers.cloud — bare-metal от ~₽30-40k/мес. Selectel/MWS — дороже из-за корпоративных требований. Pay-per-task (gpupool, Replicate) — дешевле для рваной нагрузки.

Q: Есть ли в РФ A100 80GB в облаке?

Да, у Selectel, MWS, Cloud4y, ITGLOBAL. Цена ~₽250-400k/мес. Через managed-API часто можно платить per-second без долгосрочного контракта.

Q: Можно ли арендовать H100 в России?

Сильно сложнее — официальные поставки ограничены. У Selectel и нескольких других есть, но waitlist и цена ~₽800k-1.5M/мес. Pay-per-task — точечно (gpupool, MWS) при наличии квот.

Q: Pay-per-task или hourly — что выбрать?

Hourly выгоден при utilization > 40%. При рваной нагрузке (e-commerce, agencies, dev-tests) — pay-per-task. Часто комбинируют: hourly для baseline + pay-per-task для пиков.

Аренда GPU в РФ — выбор между hourly bare-metal и pay-per-task managed-API. Разбираем актуальный рынок: Selectel, MWS, Hostkey, gpupool, Immers, цены и важные нюансы.

Обновлено: 2026-05-19

TL;DR

Рынок аренды GPU в России в 2026 — это bare-metal hourly (Selectel, MWS, Hostkey, Cloud4y, Immers.cloud), pay-per-task managed-API (gpupool и др.) и гибриды. RTX 4090 / A4000 в облаке начинаются от ~₽30-40k/мес. A100 80GB — от ~₽250-400k/мес. H100 — точечно, ~₽800k-1.5M/мес и waitlist. Выбор зависит от утилизации GPU, юридических требований и того, нужен ли вам root-доступ к серверу.

Что такое «аренда GPU» в России

Под этим в 2026 году обычно подразумевают одну из трёх моделей:

Bare-metal hourly — арендуете физическую машину с GPU, ставите свой Linux, всё под вашим контролем. Платите за время аренды (минимум — час, обычно — месяц). Подходит для R&D и стабильной нагрузки.
Pay-per-task managed-API — провайдер держит GPU, вы шлёте задачу через API (ComfyUI workflow, LLM-запрос, image-gen prompt) и платите за выполнение. Подходит для рваной нагрузки, агентств, SaaS.
Managed VM / GPU instance — облачные VM с GPU (как AWS EC2, но в РФ): Selectel Cloud GPU, MWS Cloud GPU, Yandex Cloud DataSphere. Платите hourly/per-second, но всё ещё нужен self-managed Linux и ML-стек.

Карта провайдеров (2026)

Провайдер	Модель	GPU	Особенности
Selectel	bare-metal, cloud	A100 80GB, H100, RTX A6000, L40S	Корпоративный сегмент, ЦОД М9/М10, SLA, ФЗ-152
MWS (МТС Cloud)	bare-metal, cloud	A100, H100 (waitlist), V100	Крупный игрок, ML-площадка с MLOps стеком
Hostkey	bare-metal	RTX 4090, A4000, A5000, A6000	Дешёвый bare-metal, удобный личный кабинет
Immers.cloud	bare-metal	RTX 4090, A100	Специализация на ML, есть готовые образы
Cloud4y	cloud	V100, RTX 4090	Средний бизнес, защита по ФЗ
ITGLOBAL.COM	cloud	A100, A40	Корпоративный сегмент, защищённые контуры
gpupool	pay-per-task	A100, RTX 4090 (через managed-API)	ComfyUI/n8n как сервис, без аренды железа
Yandex Cloud DataSphere	managed	A100, V100	JupyterLab + распределённые тренинги
Sber Cloud Advanced	cloud	A100, V100	Привязка к Sber-экосистеме
GPUDC	bare-metal	RTX 3090, RTX 4090	Бюджетный сегмент

Сколько это стоит (ориентиры на 2026)

Цены меняются, но порядок величин:

GPU	Bare-metal /мес (РФ)	Bare-metal /час (РФ)	Pay-per-task (managed)
RTX 4090 24GB	₽30-50k	₽120-180	₽1-2/image (SDXL)
RTX A4000 16GB	₽25-40k	₽80-130	-
RTX A5000 24GB	₽40-60k	₽160-220	-
RTX A6000 48GB	₽70-110k	₽250-380	-
A100 40GB	₽180-260k	₽550-900	через managed
A100 80GB	₽250-400k	₽800-1300	₽X/1000 LLM tokens
H100 80GB	₽800k-1.5M (waitlist)	₽2500-4500	очень точечно
L40S 48GB	₽120-180k	₽380-550	-

«Pay-per-task» сильно зависит от типа задачи (SDXL/Flux/LLM/vision) — это не цена «за GPU», а за конкретный выполненный запрос.

Как выбрать модель аренды

Берите bare-metal hourly, если:

Утилизация GPU > 40% (т.е. железо реально молотит большую часть суток).
Нужен root-доступ, кастомные ядра, специфический setup.
Регуляторика требует контроля над физическим контуром (ФЗ-152, ГОСТ).
Стабильная нагрузка, прогнозируемый объём.

Берите managed-API / pay-per-task, если:

Рваная нагрузка: пики и провалы, средняя утилизация < 30%.
Не хотите управлять ML-инфраструктурой (vLLM, ComfyUI, CUDA-апдейты).
Нужны эпизодически редкие GPU (H100 на пиковую задачу раз в неделю).
Маленький стартап без DevOps-команды.

Гибрид:

Hourly baseline (стабильный объём генерации) + pay-per-task для пиковой нагрузки.
Это самая cost-efficient схема для среднего бизнеса 50-500 запросов в час.

Юридические аспекты для РФ

Если у вас B2B-клиенты в России, обратите внимание:

ФЗ-152 (персональные данные) — данные граждан РФ должны храниться в РФ. Если в воркфлоу попадают ПДн (фото клиентов для аватаров, голоса для TTS) — берите провайдера с ЦОД в России (Selectel М9/М10, MWS, Cloud4y, gpupool).
Аттестация по 17 приказу ФСТЭК — нужна для гос- и финсектора. У Selectel, MWS есть аттестованные сегменты, готовы дать копии аттестатов.
Импортные ограничения — H100 / B100 поставляются в РФ по особым каналам. Это сказывается на цене и waitlist.
NVIDIA EULA для GeForce — RTX 4090 (GeForce-серия) формально запрещены для datacenter-use. Большинство провайдеров игнорируют это, но юридически серая зона. Для тендерного бизнеса безопаснее A-серия (A5000/A6000) или Tesla (A40, A100).
Лицензии моделей — Flux dev, LLaMA имеют commercial-clause. Часть managed-провайдеров покупают commercial license и включают в тариф; в bare-metal лицензия — ваша забота.

Как тестировать провайдера

Перед длинным контрактом полезно прогнать 1-2 дня тестовой нагрузки:

Стабильность: запустить SDXL/Flux/LLM в цикле на 24 часа. Падений быть не должно. На bare-metal обращайте внимание на throttling (под нагрузкой температуры могут вылезать).
Сеть: для managed-API замерьте latency до их endpoint из вашего региона. Из Москвы до Питера — обычно <10ms, до Урала — 30-50ms.
Реальную скорость генерации: synthetic-бенчмарки бывают обманчивы. На SDXL замеряйте секунды на 1024×1024 с реальным workflow.
Поддержку: задайте 1-2 нетривиальных вопроса в тикеты, посмотрите время ответа.
Биллинг: для pay-per-task — попросите детализацию по 100 первых запросов, проверьте арифметику.

Типичные грабли

Скрытый egress-трафик: некоторые облака платно тарифицируют исходящий трафик. Если генерите много изображений и отдаёте их на ваш CDN — посчитайте.
«Бесплатный» storage: VPS обычно даёт 100-500 GB. Чекпойнты SD/Flux + датасеты быстро забивают это. Доп-storage часто стоит ощутимо.
Заявленный vs реальный bandwidth: на bare-metal проверьте, что заявленные 1 Gbps реально 1 Gbps, а не 100 Mbps под нагрузкой.
Дополнительные лицензии: некоторые провайдеры тарифицируют отдельно «коммерческое использование» открытых моделей.
VAT/НДС: убедитесь, что в цене из лендинга НДС учтён (для юрлиц это влияет на TCO).

Что почитать дальше

RTX 4090 в облаке — sweet spot для image gen.
A100 в облаке — рабочая лошадка ML production.
H100 в облаке — где взять в РФ, и нужен ли вам.
GPU hourly vs pay-per-task — когда какая модель выгоднее.
Аналог RunPod в России — для тех, кто привык к RunPod.

Частые вопросы

Какой провайдер дешевле для RTX 4090?

Hostkey и Immers.cloud — bare-metal от ~₽30-40k/мес. Selectel/MWS — дороже из-за корпоративных требований. Pay-per-task (gpupool, Replicate) — дешевле для рваной нагрузки.

Есть ли в РФ A100 80GB в облаке?

Да, у Selectel, MWS, Cloud4y, ITGLOBAL. Цена ~₽250-400k/мес. Через managed-API часто можно платить per-second без долгосрочного контракта.

Можно ли арендовать H100 в России?

Сильно сложнее — официальные поставки ограничены. У Selectel и нескольких других есть, но waitlist и цена ~₽800k-1.5M/мес. Pay-per-task — точечно (gpupool, MWS) при наличии квот.

Pay-per-task или hourly — что выбрать?

Hourly выгоден при utilization > 40%. При рваной нагрузке (e-commerce, agencies, dev-tests) — pay-per-task. Часто комбинируют: hourly для baseline + pay-per-task для пиков.