NVIDIA B200 vs NVIDIA RTX PRO 6000 Blackwell Server

Comparison NVIDIA B200 with 90 GB HBM3e and 18,944 cores vs NVIDIA RTX PRO 6000 Blackwell Server with 96 GB GDDR7 and 24,064 cores.

Loading...

Performance Rating

NVIDIA B200 outperforms NVIDIA RTX PRO 6000 Blackwell Server by 14.51% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

NVIDIA B200

65.8

NVIDIA B200

65.8
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA RTX PRO 6000 Blackwell Server

57.5

NVIDIA RTX PRO 6000 Blackwell Server

57.5

Expert Comparison

NVIDIA B200 обладает большей пропускной способностью (4.10 TB/s против 1.79 TB/s) и более высокой производительностью FP32 (74.45 TFLOPS против 126.0 TFLOPS), что делает его предпочтительным для вычислений и научных расчетов. Однако его потребление энергии в 1000 Вт против 600 Вт у NVIDIA RTX PRO 6000 Blackwell Server может быть недоступно для некоторых серверных решений. NVIDIA RTX PRO 6000 Blackwell Server предлагает более эффективное соотношение цены и производительности благодаря меньшему TDP и большей памяти (96 ГБ против 90 ГБ).

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

90 GB ×2 (180 ГБ)
🔥 +7% 96 ГБ

Memory Type

HBM3e GDDR7

Memory Bandwidth

🔥 +129% 4.10 TB/s ×2 (8.2 TB/s)
1.79 TB/s

Memory Bus Width

4,096 бит ×2 (8192 бит) 512 бит

ML Performance

FP16 (Half Precision)

1.1912 TFLOPS
🔥 +10,478% 126.0 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

74.45 TFLOPS
🔥 +69% 126.0 TFLOPS

FP64 (Double Precision)

🔥 +1,791% 37.22 TFLOPS
1.968 TFLOPS

CUDA Cores

18,944 ×2 (37888)
🔥 +27% 24,064

RT Cores

No
🔥 188

Architecture & Compatibility

GPU Architecture

Blackwell Blackwell 2.0

SM (Streaming Multiprocessor)

148
🔥 +27% 188

PCIe Version

PCIe 5.0 x16 PCIe 5.0 x16

ML Software Support

CUDA Version

10.0
🔥 12.0

CUDA Toolkit (first supported)

v12 v12

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

700
🔥 +127% 1,590

Boost Clock

1,965
🔥 +33% 2,617

Memory Clock

🔥 +14% 2,000
1,750

Power Consumption

Recommended PSU

1400 W
🔥 -29% 1000 W

Power Connector

No 1x 16-pin

TDP/TGP

1000 W
🔥 -40% 600 W

Rendering

Texture Units (TMU)

592 ×2 (1184)
🔥 +27% 752

ROP

No
🔥 188

L2 Cache

🔥 50 MB
128 MB

Benchmarks

MLPerf, llama2-70b-99.9 (fp4)

3 250 tokens/s

MLPerf, llama3.1-8b (fp4)

5 758 tokens/s

llama.cpp, llama 7B Q4_0

315.9 tokens/s

Geekbench AI, FP16

53 322 points

Geekbench AI, INT8

28 264 points

Geekbench AI, FP32

37 299 points

MLPerf, mixtral-8x7b (fp8)

3 767 tokens/s

Additional

Slots

🔥 SXM Module
Dual-slot

Release Date

March 13, 2024 March 18, 2025

Display Outputs

No outputs
4x DisplayPort 2.1b

Renting is cheaper than buying