NVIDIA Quadro P620 vs NVIDIA RTX PRO 4000 Blackwell SFF

Comparison NVIDIA Quadro P620 with 2 GB GDDR5 and 512 cores vs NVIDIA RTX PRO 4000 Blackwell SFF with 24 GB GDDR7 and 8,960 cores.

Loading...

Performance Rating

NVIDIA RTX PRO 4000 Blackwell SFF outperforms NVIDIA Quadro P620 by 953.17% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

NVIDIA Quadro P620

1.3

NVIDIA Quadro P620

1.3
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA RTX PRO 4000 Blackwell SFF

13.3

NVIDIA RTX PRO 4000 Blackwell SFF

13.3

Expert Comparison

NVIDIA Quadro P620 лучше подходит для базовых задач, таких как обработка изображений и простые расчеты, благодаря своей энергоэффективности и низкому TDP в 40 Вт. NVIDIA RTX PRO 4000 Blackwell SFF же значительно выигрывает в производительности, особенно в вычислениях с плавающей запятой и графической обработке, благодаря большему количеству ядер, памяти и пропускной способности. Этот GPU идеально подходит для сложных профессиональных задач и требует больше мощности, что соответствует его высокому TDP в 70 Вт.

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

2 GB
🔥 +1,100% 24 ГБ

Memory Type

GDDR5 GDDR7

Memory Bandwidth

80.13 GB/s 432.0 GB/s

Memory Bus Width

128 бит 192 бит

ML Performance

FP16 (Half Precision)

0.0217 TFLOPS
🔥 +118,149% 25.66 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

1.3865 TFLOPS
🔥 +1,751% 25.66 TFLOPS

FP64 (Double Precision)

0.0433 TFLOPS
🔥 +826% 0.401 TFLOPS

CUDA Cores

512
🔥 +1,650% 8,960

RT Cores

No
🔥 70

Architecture & Compatibility

GPU Architecture

Pascal Blackwell 2.0

SM (Streaming Multiprocessor)

4
🔥 +1,650% 70

PCIe Version

PCIe 3.0 x16 PCIe 5.0 x8

ML Software Support

CUDA Version

6.1
🔥 12.0

CUDA Toolkit (first supported)

v8 v12

CUDA Toolkit (deprecated)

v12

CUDA Toolkit (support removed)

v13

CUDA Toolkit status

Removed Supported

Clocks & Performance

Base Clock

1,266
🔥 577

Boost Clock

1,354
🔥 +6% 1,432

Memory Clock

1,252
🔥 1,125

Power Consumption

Recommended PSU

🔥 -20% 200 W
250 W

Power Connector

None None

TDP/TGP

🔥 -43% 40 W
70 W

Rendering

Texture Units (TMU)

32
🔥 +775% 280

ROP

No
🔥 70

L2 Cache

1024 KB
🔥 48 MB

Benchmarks

llama.cpp, llama-2-7b-Q4_0

74.7 tokens/s

Additional

Slots

Single-slot Dual-slot

Release Date

Feb. 1, 2018 Aug. 11, 2025

Display Outputs

4x mini-DisplayPort 1.4a
4x mini-DisplayPort 2.1b

Renting is cheaper than buying