NVIDIA B200 vs NVIDIA RTX PRO 4000 Blackwell SFF

Comparison NVIDIA B200 with 90 GB HBM3e and 18,944 cores vs NVIDIA RTX PRO 4000 Blackwell SFF with 24 GB GDDR7 and 8,960 cores.

Loading...

Performance Rating

NVIDIA B200 outperforms NVIDIA RTX PRO 4000 Blackwell SFF by 395.93% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

NVIDIA B200

65.8

NVIDIA B200

65.8
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA RTX PRO 4000 Blackwell SFF

13.3

NVIDIA RTX PRO 4000 Blackwell SFF

13.3

Expert Comparison

NVIDIA B200 обладает значительно большей пропускной способностью и большим объемом памяти (90 ГБ HBM3e против 24 ГБ GDDR7), что делает его более подходящим для вычислительных задач и больших данных. Его TDP в 1000 Вт также указывает на более мощное и гибкое использование. В то время как NVIDIA RTX PRO 4000 Blackwell SFF более энергоэффективен (70 Вт) и подходит для менее требовательных задач, таких как графика и базовые вычисления.

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

🔥 +275% 90 ГБ ×2 (180 ГБ)
24 GB

Memory Type

HBM3e GDDR7

Memory Bandwidth

🔥 4.10 TB/s ×2 (8.2 TB/s)
432.0 GB/s

Memory Bus Width

4,096 бит ×2 (8192 бит) 192 бит

ML Performance

FP16 (Half Precision)

1.1912 TFLOPS
🔥 +2,054% 25.66 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

🔥 +190% 74.45 TFLOPS
25.66 TFLOPS

FP64 (Double Precision)

🔥 +9,182% 37.22 TFLOPS
0.401 TFLOPS

CUDA Cores

🔥 +111% 18,944 ×2 (37888)
8,960

RT Cores

No
🔥 70

Architecture & Compatibility

GPU Architecture

Blackwell Blackwell 2.0

SM (Streaming Multiprocessor)

🔥 +111% 148
70

PCIe Version

PCIe 5.0 x16 PCIe 5.0 x8

ML Software Support

CUDA Version

10.0
🔥 12.0

CUDA Toolkit (first supported)

v12 v12

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

🔥 +21% 700
577

Boost Clock

🔥 +37% 1,965
1,432

Memory Clock

🔥 +78% 2,000
1,125

Power Consumption

Recommended PSU

1400 W
🔥 -82% 250 W

Power Connector

No None

TDP/TGP

1000 W
🔥 -93% 70 W

Rendering

Texture Units (TMU)

🔥 +111% 592 ×2 (1184)
280

ROP

No
🔥 70

L2 Cache

🔥 +4% 50 MB
48 MB

Benchmarks

llama.cpp, llama 7B Q4_0

315.9 tokens/s

Additional

Slots

🔥 SXM Module
Dual-slot

Release Date

March 13, 2024 Aug. 11, 2025

Display Outputs

No outputs
4x mini-DisplayPort 2.1b

Renting is cheaper than buying