AMD FirePro D300 vs NVIDIA H200 SXM 141 GB

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

2 GB

+6 950% 141 ГБ

Тип памяти

GDDR5 HBM3e

Пропускная способность памяти

162.6 GB/s

4.89 TB/s

Ширина шины памяти

256 бит 6 144 бит

ML-производительность

FP16 (half)

Нет

267,6 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

2,176 TFLOPS

+2 975% 66,91 TFLOPS

FP64 (double)

0,136 TFLOPS

+24 496% 33,45 TFLOPS

CUDA ядра

1 280

+1 220% 16 896

RT ядра

Нет Нет

Архитектура и совместимость

Архитектура GPU

GCN 1.0 Hopper

SM (Streaming Multiprocessor)

Нет

132

PCIe версия

PCIe 3.0 x16 PCIe 5.0 x16

Программная поддержка ML

CUDA версия

Нет 9.0

CUDA Toolkit (начало поддержки)

— v12

Статус CUDA Toolkit

Поддерживается Поддерживается

Частоты и производительность

Base Clock

Нет

1 500

Boost Clock

Нет

1 980

Memory Clock

1 270

+25% 1 593

Энергопотребление

Рекомендуемый БП

-59% 450 W

1100 W

Разъём питания

Нет 8-pin EPS

TDP/TGP

-79% 150 W

700 W

Рендеринг

Текстурные блоки (TMU)

+560% 528

ROP

Нет Нет

L2 Cache

512 KB

50 MB

Бенчмарки

MLPerf, llama2-70b-99.9 (UNSET)

— 3 534 tokens/s

MLPerf, llama2-70b-99.9 (fp16)

— 3 553 tokens/s

MLPerf, llama2-70b-99.9 (fp8)

— 2 444 tokens/s

MLPerf, llama3.1-405b (fp16)

— 40.8 tokens/s

MLPerf, llama3.1-405b (fp8)

— 25.3 tokens/s

MLPerf, llama3.1-8b (fp8)

— 5 161 tokens/s

MLPerf, deepseek-r1 (fp8)

— 1 113 tokens/s

MLPerf, mixtral-8x7b (fp8)

— 7 132 tokens/s

Дополнительно

Слоты

Single-slot

SXM Module

Дата выпуска

18 января 2014 г. 18 ноября 2024 г.

Дисплейные порты

4x DisplayPort 1.2

No outputs

Арендовать дешевле, чем покупать

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

от 375,0 руб/час

Арендовать

Подробнее

H100 80Gb PCIe (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

от 200,89 руб/час

Арендовать

Подробнее

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

от 81,85 руб/час

Арендовать

Подробнее

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 34,23 руб/час

Арендовать

Подробнее

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 31,25 руб/час

Арендовать

Подробнее

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

от 26,79 руб/час

Арендовать

Подробнее

AMD FirePro D300 vs NVIDIA H200 SXM 141 GB

Сравнение AMD FirePro D300 с 2 Гб GDDR5 и 1 280 ядрами против NVIDIA H200 SXM 141 GB с 141 Гб HBM3e и 16 896 ядрами.