NVIDIA A100 PCIe 80 GB vs NVIDIA RTX PRO 5000 Blackwell Embedded

Сравнение NVIDIA A100 PCIe 80 GB с 80 Гб HBM2e и 6 912 ядрами против NVIDIA RTX PRO 5000 Blackwell Embedded с 24 Гб GDDR7 и 10 496 ядрами.

Загружаемся...

Оценка производительности

NVIDIA A100 PCIe 80 GB опережает NVIDIA RTX PRO 5000 Blackwell Embedded на 33,56% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA A100 PCIe 80 GB

25,6

NVIDIA A100 PCIe 80 GB

25,6
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA RTX PRO 5000 Blackwell Embedded

19,2

NVIDIA RTX PRO 5000 Blackwell Embedded

19,2

Экспертное сравнение

NVIDIA A100 PCIe 80 GB обладает значительно большей памятью (80 ГБ против 24 ГБ) и пропускной способностью (1.94 ТБ/с против 896 ГБ/с), что делает её более подходящей для вычислительных задач, требующих больших объемов данных. В то же время, NVIDIA RTX PRO 5000 Blackwell Embedded имеет более низкое энергопотребление (95 Вт против 300 Вт) и выше производительность в FP32 (36.53 ТФЛПС против 19.49 ТФЛПС), что делает её предпочтительной для графических задач и менее энергоемких вычислений.

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Дополнительно

Память

Объем памяти

🔥 +233% 80 ГБ
24 GB

Тип памяти

HBM2e GDDR7

Пропускная способность памяти

🔥 1.94 TB/s
896.0 GB/s

Ширина шины памяти

5 120 бит 256 бит

ML-производительность

FP16 (half)

🔥 +113% 77,97 TFLOPS
36,53 TFLOPS

BF16

🔥 311,84 TFLOPS
Нет

TF32

🔥 155,92
Нет

Вычислительная мощность

FP32 (float)

🔥 19,49 TFLOPS
36,53 TFLOPS

FP64 (double)

🔥 +1 608% 9,746 TFLOPS
0,5707 TFLOPS

CUDA ядра

🔥 6 912
10 496

RT ядра

Нет 82

Архитектура и совместимость

Архитектура GPU

Ampere Blackwell 2.0

SM (Streaming Multiprocessor)

🔥 +32% 108
82

PCIe версия

PCIe 4.0 x16 PCIe 5.0 x16

Программная поддержка ML

CUDA версия

8.0
🔥 12.0

CUDA Toolkit (начало поддержки)

v11 v12

Статус CUDA Toolkit

Поддерживается Поддерживается

Частоты и производительность

Base Clock

🔥 1 065
1 095

Boost Clock

🔥 1 410
1 740

Memory Clock

🔥 1 512
1 750

Энергопотребление

Рекомендуемый БП

700 W Нет

Разъём питания

8-pin EPS None

TDP/TGP

300 W
🔥 -68% 95 W

Рендеринг

Текстурные блоки (TMU)

🔥 +32% 432
328

ROP

Нет 82

L2 Cache

🔥 +25% 80 MB
64 MB

Дополнительно

Слоты

Dual-slot IGP

Дата выпуска

28 июня 2021 г. Нет

Дисплейные порты

No outputs
Portable Device Dependent

Арендовать дешевле, чем покупать