NVIDIA GeForce RTX 4090 Max-Q vs NVIDIA H200 SXM 141 GB

Сравнение NVIDIA GeForce RTX 4090 Max-Q с 16 Гб GDDR6 и 9 728 ядрами против NVIDIA H200 SXM 141 GB с 141 Гб HBM3e и 16 896 ядрами.

Загружаемся...

Оценка производительности

NVIDIA H200 SXM 141 GB опережает NVIDIA GeForce RTX 4090 Max-Q на 368,89% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA GeForce RTX 4090 Max-Q

14,4

NVIDIA GeForce RTX 4090 Max-Q

14,4
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA H200 SXM 141 GB

67,4

NVIDIA H200 SXM 141 GB

67,4

Экспертное сравнение

NVIDIA GeForce RTX 4090 Max-Q лучше для среднего уровня игр и творческих задач благодаря своей более низкой потребляемой мощности (80 Вт) и хорошему соотношению цены и производительности (GPI 14.4). NVIDIA H200 SXM 141 GB же значительно превосходит в мощности для вычислений и больших данных из-за огромной памяти (141 ГБ HBM3e) и высокой пропускной способности (4.89 TB/s), но при этом требует гораздо больше энергии (700 Вт) и доступен только для серверных решений.

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

16 GB
🔥 +781% 141 ГБ

Тип памяти

GDDR6 HBM3e

Пропускная способность памяти

576.0 GB/s
🔥 4.89 TB/s

Ширина шины памяти

256 бит 6 144 бит

ML-производительность

FP16 (half)

28,31 TFLOPS
🔥 +845% 267,6 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

28,31 TFLOPS
🔥 +136% 66,91 TFLOPS

FP64 (double)

0,4423 TFLOPS
🔥 +7 463% 33,45 TFLOPS

CUDA ядра

9 728
🔥 +74% 16 896

RT ядра

🔥 76
Нет

Архитектура и совместимость

Архитектура GPU

Ada Lovelace Hopper

SM (Streaming Multiprocessor)

76
🔥 +74% 132

PCIe версия

PCIe 4.0 x16 PCIe 5.0 x16

Программная поддержка ML

CUDA версия

8.9
🔥 9.0

CUDA Toolkit (начало поддержки)

v11 v12

Статус CUDA Toolkit

Поддерживается Поддерживается

Частоты и производительность

Base Clock

930
🔥 +61% 1 500

Boost Clock

1 455
🔥 +36% 1 980

Memory Clock

🔥 +41% 2 250
1 593

Энергопотребление

Рекомендуемый БП

Нет 1100 W

Разъём питания

None 8-pin EPS

TDP/TGP

🔥 -89% 80 W
700 W

Рендеринг

Текстурные блоки (TMU)

304
🔥 +74% 528

ROP

🔥 76
Нет

L2 Cache

🔥 +28% 64 MB
50 MB

Бенчмарки

MLPerf, llama2-70b-99.9 (UNSET)

3 534 tokens/s

MLPerf, llama2-70b-99.9 (fp16)

3 553 tokens/s

MLPerf, llama2-70b-99.9 (fp8)

2 444 tokens/s

MLPerf, llama3.1-405b (fp16)

40.8 tokens/s

MLPerf, llama3.1-405b (fp8)

25.3 tokens/s

MLPerf, llama3.1-8b (fp8)

5 161 tokens/s

MLPerf, deepseek-r1 (fp8)

1 113 tokens/s

MLPerf, mixtral-8x7b (fp8)

7 132 tokens/s

Дополнительно

Слоты

IGP
🔥 SXM Module

Дата выпуска

3 января 2023 г. 18 ноября 2024 г.

Дисплейные порты

Portable Device Dependent
No outputs

Арендовать в Intelion Cloud

H200 (141GB)

Доступна в аренде в Intelion Cloud

от 375,0 руб/час Арендовать
Посекундная тарификация
Цены включают НДС 22%
ЭДО и закрывающие документы
Сервер готов за 3 минуты
Техподдержка на русском
Картой, СБП или по счёту