NVIDIA A100 PCIe 80 GB vs NVIDIA H200 NVL

Сравнение NVIDIA A100 PCIe 80 GB с 80 Гб HBM2e и 6 912 ядрами против NVIDIA H200 NVL с 141 Гб HBM3e и 16 896 ядрами.

Загружаемся...

Оценка производительности

H200 H200
MI325X MI325X
A100 A100

NVIDIA A100 PCIe 80 GB

NVIDIA A100 PCIe 80 GB

MI250 MI250
Instinct MI300X Instinct MI300X
RX 7900 XTX RX 7900 XTX

NVIDIA H200 NVL

63,6

NVIDIA H200 NVL

63,6

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

80 GB
🔥 +76% 141 ГБ

Тип памяти

HBM2e HBM3e

Пропускная способность памяти

1.94 TB/s
🔥 +152% 4.89 TB/s

Ширина шины памяти

5 120 бит 6 144 бит

ML-производительность

FP16 (half)

77,97 TFLOPS
🔥 +209% 241,3 TFLOPS

BF16

311,84 TFLOPS Нет

TF32

155,92 Нет

Вычислительная мощность

FP32 (float)

19,49 TFLOPS
🔥 +209% 60,32 TFLOPS

FP64 (double)

9,746 TFLOPS
🔥 +209% 30,16 TFLOPS

CUDA ядра

6 912
🔥 +144% 16 896

RT ядра

Нет Нет

Архитектура и совместимость

Архитектура GPU

Ampere Hopper

SM (Streaming Multiprocessor)

108
🔥 +22% 132

PCIe версия

PCIe 4.0 x16 PCIe 5.0 x16

Программная поддержка ML

CUDA версия

8.0
🔥 9.0

Частоты и производительность

Base Clock

1 065
🔥 +28% 1 365

Boost Clock

1 410
🔥 +27% 1 785

Memory Clock

1 512
🔥 +5% 1 593

Энергопотребление

TDP/TGP

🔥 -50% 300 W
600 W

Рекомендуемый БП

🔥 -30% 700 W
1000 W

Разъём питания

8-pin EPS 8-pin EPS

Рендеринг

Текстурные блоки (TMU)

432
🔥 +22% 528

ROP

Нет Нет

L2 Cache

80 MB
🔥 50 MB

Бенчмарки

MLPerf, llama2-70b-99.9 (fp4)

7 436 tokens/s

MLPerf, llama3.1-405b (fp4)

130.5 tokens/s

MLPerf, deepseek-r1 (fp4)

2 327 tokens/s

Дополнительно

Слоты

Dual-slot Dual-slot

Дата выпуска

28 июня 2021 г. 18 ноября 2024 г.

Дисплейные порты

No outputs
No outputs

Арендовать дешевле, чем покупать