NVIDIA L40-2Q vs NVIDIA RTX PRO 6000 Blackwell Server

NVIDIA L40-2Q

NVIDIA RTX PRO 6000 Blackwell Server

Оценка производительности

H200 H200

MI325X MI325X

A100 A100

NVIDIA L40-2Q

22,5

NVIDIA L40-2Q

22,5

MI250 MI250

Instinct MI300X Instinct MI300X

RX 7900 XTX RX 7900 XTX

NVIDIA RTX PRO 6000 Blackwell Server

Память

Объем памяти

2 ГБ

96 GB

Тип памяти

GDDR6 GDDR7

Пропускная способность памяти

864.0 GB/s 1.79 TB/s

Ширина шины памяти

384 бит 512 бит

ML-производительность

FP16 (half)

90,52 TFLOPS

126,0 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

90,52 TFLOPS

126,0 TFLOPS

FP64 (double)

Нет 1,968 TFLOPS

CUDA ядра

18 176

24 064

RT ядра

142

188

Архитектура и совместимость

Архитектура GPU

Ada Lovelace Blackwell 2.0

SM (Streaming Multiprocessor)

142

188

PCIe версия

PCIe 4.0 x16 PCIe 5.0 x16

Программная поддержка ML

CUDA версия

8.9

12.0

Частоты и производительность

Base Clock

735

1 590

Boost Clock

2 490

2 617

Memory Clock

+29% 2 250

1 750

Энергопотребление

TDP/TGP

-50% 300 W

600 W

Рекомендуемый БП

-30% 700 W

1000 W

Разъём питания

1x 16-pin 1x 16-pin

Рендеринг

Текстурные блоки (TMU)

568

752

ROP

142

188

L2 Cache

96 MB

128 MB

Бенчмарки

MLPerf, llama2-70b-99.9 (fp4)

— 3 250 tokens/s

MLPerf, llama3.1-8b (fp4)

— 5 758 tokens/s

Geekbench AI, FP16

— 53 322 points

Geekbench AI, INT8

— 28 264 points

Geekbench AI, FP32

— 37 299 points

MLPerf, mixtral-8x7b (fp8)

— 3 767 tokens/s

Дополнительно

Слоты

Dual-slot Dual-slot

Дата выпуска

13 октября 2022 г. 18 марта 2025 г.

Дисплейные порты

4x DisplayPort 1.4a

4x DisplayPort 2.1b

Арендовать дешевле, чем покупать

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

от 375,0 руб/час

Арендовать

Подробнее

H100 80Gb PCIe (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

от 200,89 руб/час

Арендовать

Подробнее

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

от 81,85 руб/час

Арендовать

Подробнее

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 34,23 руб/час

Арендовать

Подробнее

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 31,25 руб/час

Арендовать

Подробнее

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

от 26,79 руб/час

Арендовать

Подробнее

NVIDIA L40-2Q vs NVIDIA RTX PRO 6000 Blackwell Server

Сравнение NVIDIA L40-2Q с 2 Гб GDDR6 и 18 176 ядрами против NVIDIA RTX PRO 6000 Blackwell Server с 96 Гб GDDR7 и 24 064 ядрами.