NVIDIA A800 SXM4 80 GB vs NVIDIA RTX PRO 4000 Blackwell Embedded

Comparison NVIDIA A800 SXM4 80 GB with 80 GB HBM2e and 6,912 cores vs NVIDIA RTX PRO 4000 Blackwell Embedded with 16 GB GDDR7 and 7,680 cores.

Loading...

Performance Rating

NVIDIA A800 SXM4 80 GB outperforms NVIDIA RTX PRO 4000 Blackwell Embedded by 72.26% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

NVIDIA A800 SXM4 80 GB

25.9

NVIDIA A800 SXM4 80 GB

25.9
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA RTX PRO 4000 Blackwell Embedded

15.0

NVIDIA RTX PRO 4000 Blackwell Embedded

15.0

Expert Comparison

NVIDIA A800 SXM4 80 GB обладает значительно большей пропускной способностью (2.04 ТБ/с против 896 ГБ/с) и более высоким показателем GPU Performance Index (25.9 против 15.0), что делает ее лучшим выбором для вычислительных задач, машинного обучения и графики высокого разрешения. Однако она потребляет больше энергии (400 Вт против 80 Вт) и имеет меньшее количество ядер (6912 против 7680). NVIDIA RTX PRO 4000 Blackwell Embedded лучше подходит для менее интенсивных задач благодаря своей более низкой мощности и меньшей памяти, но все же обеспечивает хорошую производительность для визуализации и базовых вычислений.

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Additional

Memory

Memory Size

🔥 +400% 80 ГБ
16 GB

Memory Type

HBM2e GDDR7

Memory Bandwidth

🔥 2.04 TB/s
896.0 GB/s

Memory Bus Width

5,120 бит 256 бит

ML Performance

FP16 (Half Precision)

🔥 +198% 77.97 TFLOPS
26.14 TFLOPS

BF16 (Brain Float)

🔥 311.84 TFLOPS
No

TF32 (TensorFloat)

🔥 155.92
No

Compute Power

FP32 (Single Precision)

🔥 19.49 TFLOPS
26.14 TFLOPS

FP64 (Double Precision)

🔥 +2,286% 9.746 TFLOPS
0.4085 TFLOPS

CUDA Cores

🔥 6,912
7,680

RT Cores

No 60

Architecture & Compatibility

GPU Architecture

Ampere Blackwell 2.0

SM (Streaming Multiprocessor)

🔥 +80% 108
60

PCIe Version

PCIe 4.0 x16 PCIe 5.0 x16

ML Software Support

CUDA Version

8.0
🔥 12.0

CUDA Toolkit (first supported)

v11 v12

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

🔥 +18% 1,155
975

Boost Clock

🔥 1,410
1,702

Memory Clock

🔥 1,593
1,750

Power Consumption

Recommended PSU

800 W No

Power Connector

None None

TDP/TGP

400 W
🔥 -80% 80 W

Rendering

Texture Units (TMU)

🔥 +80% 432
240

ROP

No 60

L2 Cache

🔥 40 MB
64 MB

Additional

Slots

🔥 SXM Module
IGP

Release Date

Aug. 11, 2022 No

Display Outputs

No outputs
Portable Device Dependent

Renting is cheaper than buying