NVIDIA CMP 40HX vs NVIDIA H200 SXM 141 GB

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

8 GB

+1,662% 141 ГБ

Memory Type

GDDR6 HBM3e

Memory Bandwidth

448.0 GB/s

4.89 TB/s

Memory Bus Width

256 бит 6,144 бит

ML Performance

FP16 (Half Precision)

15.21 TFLOPS

+1,659% 267.6 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

7.603 TFLOPS

+780% 66.91 TFLOPS

FP64 (Double Precision)

0.2376 TFLOPS

+13,978% 33.45 TFLOPS

CUDA Cores

2,304

+633% 16,896

RT Cores

Architecture & Compatibility

GPU Architecture

Turing Hopper

SM (Streaming Multiprocessor)

+267% 132

PCIe Version

PCIe 1.0 x4 PCIe 5.0 x16

ML Software Support

CUDA Version

7.5

9.0

CUDA Toolkit (first supported)

v10 v12

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

1,470

+2% 1,500

Boost Clock

1,650

+20% 1,980

Memory Clock

+10% 1,750

1,593

Power Consumption

Recommended PSU

-59% 450 W

1100 W

Power Connector

1x 8-pin 8-pin EPS

TDP/TGP

-74% 185 W

700 W

Rendering

Texture Units (TMU)

144

+267% 528

ROP

L2 Cache

4 MB

+1,150% 50 MB

Benchmarks

MLPerf, llama2-70b-99.9 (UNSET)

— 3 534 tokens/s

MLPerf, llama2-70b-99.9 (fp16)

— 3 553 tokens/s

MLPerf, llama2-70b-99.9 (fp8)

— 2 444 tokens/s

MLPerf, llama3.1-405b (fp16)

— 40.8 tokens/s

MLPerf, llama3.1-405b (fp8)

— 25.3 tokens/s

MLPerf, llama3.1-8b (fp8)

— 5 161 tokens/s

MLPerf, deepseek-r1 (fp8)

— 1 113 tokens/s

MLPerf, mixtral-8x7b (fp8)

— 7 132 tokens/s

Additional

Slots

Dual-slot

SXM Module

Release Date

Feb. 25, 2021 Nov. 18, 2024

Display Outputs

No outputs

Renting is cheaper than buying

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

from 375.0 RUB/hour

Rent

Details

H100 80Gb PCIe (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

from 299.11 RUB/hour

Rent

Details

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

from 299.11 RUB/hour

Rent

Details

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

from 200.89 RUB/hour

Rent

Details

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

from 81.85 RUB/hour

Rent

Details

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

from 34.23 RUB/hour

Rent

Details

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

from 31.25 RUB/hour

Rent

Details

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

from 26.79 RUB/hour

Rent

Details

NVIDIA CMP 40HX vs NVIDIA H200 SXM 141 GB

Comparison NVIDIA CMP 40HX with 8 GB GDDR6 and 2,304 cores vs NVIDIA H200 SXM 141 GB with 141 GB HBM3e and 16,896 cores.