NVIDIA CMP 70HX vs NVIDIA GeForce RTX 4090

Сравнение NVIDIA CMP 70HX с 8 Гб GDDR6X и 3 840 ядрами против NVIDIA GeForce RTX 4090 с 24 Гб GDDR6X и 16 384 ядрами.

Загружаемся...

Оценка производительности

H200 H200
MI325X MI325X
A100 A100

NVIDIA CMP 70HX

NVIDIA CMP 70HX

MI250 MI250
Instinct MI300X Instinct MI300X
RX 7900 XTX RX 7900 XTX

NVIDIA GeForce RTX 4090

32,1

NVIDIA GeForce RTX 4090

32,1

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

8 GB
🔥 +200% 24 ГБ

Тип памяти

GDDR6X GDDR6X

Пропускная способность памяти

608.3 GB/s
🔥 1.01 TB/s

Ширина шины памяти

256 бит 384 бит

ML-производительность

FP16 (half)

10,71 TFLOPS
🔥 +671% 82,58 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

10,71 TFLOPS
🔥 +671% 82,58 TFLOPS

FP64 (double)

0,1674 TFLOPS Нет

CUDA ядра

3 840
🔥 +327% 16 384

RT ядра

30
🔥 +327% 128

Архитектура и совместимость

Архитектура GPU

Ampere Ada Lovelace

SM (Streaming Multiprocessor)

30
🔥 +327% 128

PCIe версия

PCIe 1.0 x4 PCIe 4.0 x16

Программная поддержка ML

CUDA версия

8.6
🔥 8.9

Частоты и производительность

Base Clock

1 365
🔥 +64% 2 235

Boost Clock

1 395
🔥 +81% 2 520

Memory Clock

1 188
🔥 +11% 1 313

Энергопотребление

TDP/TGP

unknown 450 W

Рекомендуемый БП

🔥 -76% 200 W
850 W

Разъём питания

1x 12-pin 1x 16-pin

Рендеринг

Текстурные блоки (TMU)

120
🔥 +327% 512

ROP

30
🔥 +327% 128

L2 Cache

4 MB
🔥 +1 700% 72 MB

Бенчмарки

MLPerf, llama3.1-8b-edge (fp32)

44.7 tokens/s

llama.cpp, llama 7B Q4_0

154.7 tokens/s

llama.cpp, llama-2-7b-Q4_0

189.0 tokens/s

Geekbench AI, FP16

53 496 points

Geekbench AI, INT8

29 155 points

Geekbench AI, FP32

39 033 points

Дополнительно

Слоты

Dual-slot Triple-slot

Дата выпуска

11 марта 2021 г. 20 сентября 2022 г.

Дисплейные порты

No outputs
1x HDMI 2.1
3x DisplayPort 1.4a

Арендовать дешевле, чем покупать