NVIDIA B200 vs NVIDIA RTX PRO 4000 Blackwell SFF

Сравнение NVIDIA B200 с 90 Гб HBM3e и 18 944 ядрами против NVIDIA RTX PRO 4000 Blackwell SFF с 24 Гб GDDR7 и 8 960 ядрами.

Загружаемся...

Оценка производительности

NVIDIA B200 опережает NVIDIA RTX PRO 4000 Blackwell SFF на 395,93% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA B200

65,8

NVIDIA B200

65,8
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA RTX PRO 4000 Blackwell SFF

13,3

NVIDIA RTX PRO 4000 Blackwell SFF

13,3

Экспертное сравнение

NVIDIA B200 лучше по многим параметрам: имеет больше ядер (18944 против 8960), больше памяти (90 ГБ HBM3e против 24 ГБ GDDR7) и гораздо большую пропускную способность (4.10 ТБ/с против 432 ГБ/с). Он также имеет значительно более высокий индекс производительности (GPI 65.8 против 13.3). Однако B200 потребляет намного больше энергии (1000 Вт против 70 Вт) и предназначен для более мощных задач. RTX PRO 4000 Blackwell SFF более энергоэффективный и подходит для менее требовательных задач благодаря своей низкой TDP и более высокой частоте работы.

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

🔥 +275% 90 ГБ ×2 (180 ГБ)
24 GB

Тип памяти

HBM3e GDDR7

Пропускная способность памяти

🔥 4.10 TB/s ×2 (8.2 TB/s)
432.0 GB/s

Ширина шины памяти

4 096 бит ×2 (8192 бит) 192 бит

ML-производительность

FP16 (half)

1,1912 TFLOPS
🔥 +2 054% 25,66 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

🔥 +190% 74,45 TFLOPS
25,66 TFLOPS

FP64 (double)

🔥 +9 182% 37,22 TFLOPS
0,401 TFLOPS

CUDA ядра

🔥 +111% 18 944 ×2 (37888)
8 960

RT ядра

Нет
🔥 70

Архитектура и совместимость

Архитектура GPU

Blackwell Blackwell 2.0

SM (Streaming Multiprocessor)

🔥 +111% 148
70

PCIe версия

PCIe 5.0 x16 PCIe 5.0 x8

Программная поддержка ML

CUDA версия

10.0
🔥 12.0

CUDA Toolkit (начало поддержки)

v12 v12

Статус CUDA Toolkit

Поддерживается Поддерживается

Частоты и производительность

Base Clock

🔥 +21% 700
577

Boost Clock

🔥 +37% 1 965
1 432

Memory Clock

🔥 +78% 2 000
1 125

Энергопотребление

Рекомендуемый БП

1400 W
🔥 -82% 250 W

Разъём питания

Нет None

TDP/TGP

1000 W
🔥 -93% 70 W

Рендеринг

Текстурные блоки (TMU)

🔥 +111% 592 ×2 (1184)
280

ROP

Нет
🔥 70

L2 Cache

🔥 +4% 50 MB
48 MB

Бенчмарки

llama.cpp, llama 7B Q4_0

315.9 tokens/s

Дополнительно

Слоты

🔥 SXM Module
Dual-slot

Дата выпуска

13 марта 2024 г. 11 августа 2025 г.

Дисплейные порты

No outputs
4x mini-DisplayPort 2.1b

Арендовать дешевле, чем покупать