NVIDIA GeForce RTX 4090 Max-Q vs NVIDIA RTX PRO 6000 Blackwell Server

A100 A100

H200 H200

MI325X MI325X

NVIDIA GeForce RTX 4090 Max-Q

14.4

NVIDIA GeForce RTX 4090 Max-Q

14.4

RX 7900 XTX RX 7900 XTX

MI250 MI250

Instinct MI300X Instinct MI300X

NVIDIA RTX PRO 6000 Blackwell Server

57.5

NVIDIA RTX PRO 6000 Blackwell Server

57.5

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

16 GB

+500% 96 ГБ

Memory Type

GDDR6 GDDR7

Memory Bandwidth

576.0 GB/s

1.79 TB/s

Memory Bus Width

256 бит 512 бит

ML Performance

FP16 (Half Precision)

28.31 TFLOPS

+345% 126.0 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

28.31 TFLOPS

+345% 126.0 TFLOPS

FP64 (Double Precision)

0.4423 TFLOPS

+345% 1.968 TFLOPS

CUDA Cores

9,728

+147% 24,064

RT Cores

+147% 188

Architecture & Compatibility

GPU Architecture

Ada Lovelace Blackwell 2.0

SM (Streaming Multiprocessor)

+147% 188

PCIe Version

PCIe 4.0 x16 PCIe 5.0 x16

ML Software Support

CUDA Version

8.9

12.0

CUDA Toolkit (first supported)

v11 v12

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

930

+71% 1,590

Boost Clock

1,455

+80% 2,617

Memory Clock

+29% 2,250

1,750

Power Consumption

Recommended PSU

No 1000 W

Power Connector

None 1x 16-pin

TDP/TGP

-87% 80 W

600 W

Rendering

Texture Units (TMU)

304

+147% 752

ROP

+147% 188

L2 Cache

64 MB

128 MB

Benchmarks

MLPerf, llama2-70b-99.9 (fp4)

— 3 250 tokens/s

MLPerf, llama3.1-8b (fp4)

— 5 758 tokens/s

Geekbench AI, FP16

— 53 322 points

Geekbench AI, INT8

— 28 264 points

Geekbench AI, FP32

— 37 299 points

MLPerf, mixtral-8x7b (fp8)

— 3 767 tokens/s

Additional

Slots

IGP Dual-slot

Release Date

Jan. 3, 2023 March 18, 2025

Display Outputs

Portable Device Dependent

4x DisplayPort 2.1b

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

from 375.0 RUB/hour

Rent

Details

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

from 299.11 RUB/hour

Rent

Details

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

from 200.89 RUB/hour

Rent

Details

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

from 81.85 RUB/hour

Rent

Details

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

from 34.23 RUB/hour

Rent

Details

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

from 31.25 RUB/hour

Rent

Details

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

from 26.79 RUB/hour

Rent

Details

NVIDIA GeForce RTX 4090 Max-Q vs NVIDIA RTX PRO 6000 Blackwell Server

Comparison NVIDIA GeForce RTX 4090 Max-Q with 16 GB GDDR6 and 9,728 cores vs NVIDIA RTX PRO 6000 Blackwell Server with 96 GB GDDR7 and 24,064 cores.