NVIDIA CMP 40HX vs NVIDIA H200 SXM 141 GB

Comparison NVIDIA CMP 40HX with 8 GB GDDR6 and 2,304 cores vs NVIDIA H200 SXM 141 GB with 141 GB HBM3e and 16,896 cores.

Loading...

Performance Rating

NVIDIA H200 SXM 141 GB outperforms NVIDIA CMP 40HX by 1,026.76% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

NVIDIA CMP 40HX

6.0

NVIDIA CMP 40HX

6.0
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA H200 SXM 141 GB

67.4

NVIDIA H200 SXM 141 GB

67.4

Expert Comparison

NVIDIA H200 SXM значительно превосходит NVIDIA CMP 40HX в количестве ядер (16896 против 2304), объеме памяти (141 ГБ HBM3e против 8 ГБ GDDR6) и пропускной способности (4.89 ТБ/с против 448 ГБ/с). H200 SXM также имеет более высокую производительность в вычислениях FP32 (66.91 ТФЛОПС против 7.603 ТФЛОПС) и большую TDP (700 Вт против 185 Вт). CMP 40HX лучше подходит для базовых задач и среднего класса игр, тогда как H200 SXM идеально подходит для вычислительных задач высокой сложности и обработки больших объемов данных.

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

8 GB
🔥 +1,662% 141 ГБ

Memory Type

GDDR6 HBM3e

Memory Bandwidth

448.0 GB/s
🔥 4.89 TB/s

Memory Bus Width

256 бит 6,144 бит

ML Performance

FP16 (Half Precision)

15.21 TFLOPS
🔥 +1,659% 267.6 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

7.603 TFLOPS
🔥 +780% 66.91 TFLOPS

FP64 (Double Precision)

0.2376 TFLOPS
🔥 +13,978% 33.45 TFLOPS

CUDA Cores

2,304
🔥 +633% 16,896

RT Cores

🔥 36
No

Architecture & Compatibility

GPU Architecture

Turing Hopper

SM (Streaming Multiprocessor)

36
🔥 +267% 132

PCIe Version

PCIe 1.0 x4 PCIe 5.0 x16

ML Software Support

CUDA Version

7.5
🔥 9.0

CUDA Toolkit (first supported)

v10 v12

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

1,470
🔥 +2% 1,500

Boost Clock

1,650
🔥 +20% 1,980

Memory Clock

🔥 +10% 1,750
1,593

Power Consumption

Recommended PSU

🔥 -59% 450 W
1100 W

Power Connector

1x 8-pin 8-pin EPS

TDP/TGP

🔥 -74% 185 W
700 W

Rendering

Texture Units (TMU)

144
🔥 +267% 528

ROP

🔥 36
No

L2 Cache

4 MB
🔥 +1,150% 50 MB

Benchmarks

MLPerf, llama2-70b-99.9 (UNSET)

3 534 tokens/s

MLPerf, llama2-70b-99.9 (fp16)

3 553 tokens/s

MLPerf, llama2-70b-99.9 (fp8)

2 444 tokens/s

MLPerf, llama3.1-405b (fp16)

40.8 tokens/s

MLPerf, llama3.1-405b (fp8)

25.3 tokens/s

MLPerf, llama3.1-8b (fp8)

5 161 tokens/s

MLPerf, deepseek-r1 (fp8)

1 113 tokens/s

MLPerf, mixtral-8x7b (fp8)

7 132 tokens/s

Additional

Slots

Dual-slot
🔥 SXM Module

Release Date

Feb. 25, 2021 Nov. 18, 2024

Display Outputs

No outputs
No outputs

Renting is cheaper than buying