NVIDIA B200 vs NVIDIA GeForce RTX 5090

Comparison NVIDIA B200 with 90 GB HBM3e and 18,944 cores vs NVIDIA GeForce RTX 5090 with 32 GB GDDR7 and 21,760 cores.

Loading...

Performance Rating

NVIDIA B200 outperforms NVIDIA GeForce RTX 5090 by 49.43% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

NVIDIA B200

65.8

NVIDIA B200

65.8
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA GeForce RTX 5090

44.0

NVIDIA GeForce RTX 5090

44.0

Expert Comparison

NVIDIA B200 обладает большей пропускной способностью и более высокой частотой boost, что делает его предпочтительным для вычислительных задач и AI. Однако он требует значительно больше энергии (1000 Вт против 575 Вт у GeForce RTX 5090) и имеет более низкий GPI, что указывает на менее эффективное использование ресурсов. GeForce RTX 5090 предлагает лучшую производительность в играх и графических задачах благодаря большему объему памяти и более компактному TDP.

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

🔥 +181% 90 ГБ ×2 (180 ГБ)
32 GB

Memory Type

HBM3e GDDR7

Memory Bandwidth

🔥 +129% 4.10 TB/s ×2 (8.2 TB/s)
1.79 TB/s

Memory Bus Width

4,096 бит ×2 (8192 бит) 512 бит

ML Performance

FP16 (Half Precision)

1.1912 TFLOPS
🔥 +8,698% 104.8 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

74.45 TFLOPS
🔥 +41% 104.8 TFLOPS

FP64 (Double Precision)

🔥 +2,174% 37.22 TFLOPS
1.637 TFLOPS

CUDA Cores

18,944 ×2 (37888)
🔥 +15% 21,760

RT Cores

No
🔥 170

Architecture & Compatibility

GPU Architecture

Blackwell Blackwell 2.0

SM (Streaming Multiprocessor)

148
🔥 +15% 170

PCIe Version

PCIe 5.0 x16 PCIe 5.0 x16

ML Software Support

CUDA Version

10.0
🔥 12.0

CUDA Toolkit (first supported)

v12 v12

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

700
🔥 +188% 2,017

Boost Clock

1,965
🔥 +22% 2,407

Memory Clock

🔥 +14% 2,000
1,750

Power Consumption

Recommended PSU

1400 W
🔥 -32% 950 W

Power Connector

No 1x 16-pin

TDP/TGP

1000 W
🔥 -42% 575 W

Rendering

Texture Units (TMU)

592 ×2 (1184)
🔥 +15% 680

ROP

No
🔥 170

L2 Cache

50 MB
🔥 +92% 96 MB

Benchmarks

llama.cpp, llama 7B Q4_0

🔥 315.9 tokens/s
315.3 tokens/s

llama.cpp, llama-2-7b-Q4_0

273.7 tokens/s

Geekbench AI, FP16

69 850 points

Geekbench AI, INT8

34 600 points

Geekbench AI, FP32

46 917 points

Additional

Slots

🔥 SXM Module
Dual-slot

Release Date

March 13, 2024 Jan. 30, 2025

Display Outputs

No outputs
1x HDMI 2.1b
3x DisplayPort 2.1b

Renting is cheaper than buying