AMD Radeon Instinct MI250 vs NVIDIA RTX 5000 Max-Q Ada Generation

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

+700% 128 ГБ

16 GB

Тип памяти

HBM2e GDDR6

Пропускная способность памяти

3.28 TB/s

576.0 GB/s

Ширина шины памяти

8 192 бит 256 бит

ML-производительность

FP16 (half)

+1 008% 362,1 TFLOPS

32,69 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

+38% 45,26 TFLOPS

32,69 TFLOPS

FP64 (double)

+8 762% 45,26 TFLOPS

0,5107 TFLOPS

CUDA ядра

+37% 13 312

9 728

RT ядра

Нет

Архитектура и совместимость

Архитектура GPU

CDNA 2.0 Ada Lovelace

SM (Streaming Multiprocessor)

Нет

PCIe версия

PCIe 4.0 x16 PCIe 4.0 x16

Программная поддержка ML

CUDA версия

Нет 8.9

CUDA Toolkit (начало поддержки)

— v11

Статус CUDA Toolkit

Поддерживается Поддерживается

Частоты и производительность

Base Clock

+8% 1 000

930

Boost Clock

+1% 1 700

1 680

Memory Clock

1 600

+41% 2 250

Энергопотребление

Рекомендуемый БП

900 W Нет

Разъём питания

2x 8-pin None

TDP/TGP

500 W

-76% 120 W

Рендеринг

Текстурные блоки (TMU)

+174% 832

304

ROP

Нет

L2 Cache

16 MB

+300% 64 MB

Бенчмарки

llama.cpp, llama-2-7b-Q4_0

63.9 tokens/s —

Дополнительно

Слоты

Dual-slot IGP

Дата выпуска

8 ноября 2021 г. 21 марта 2023 г.

Дисплейные порты

No outputs

Portable Device Dependent

Арендовать дешевле, чем покупать

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

от 375,0 руб/час

Арендовать

Подробнее

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

от 200,89 руб/час

Арендовать

Подробнее

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

от 81,85 руб/час

Арендовать

Подробнее

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 34,23 руб/час

Арендовать

Подробнее

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 31,25 руб/час

Арендовать

Подробнее

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

от 26,79 руб/час

Арендовать

Подробнее

AMD Radeon Instinct MI250 vs NVIDIA RTX 5000 Max-Q Ada Generation

Сравнение AMD Radeon Instinct MI250 с 128 Гб HBM2e и 13 312 ядрами против NVIDIA RTX 5000 Max-Q Ada Generation с 16 Гб GDDR6 и 9 728 ядрами.