AMD Radeon Instinct MI355X vs NVIDIA A100 PCIe 40 GB

Сравнение AMD Radeon Instinct MI355X с 288 Гб HBM3e и 16 384 ядрами против NVIDIA A100 PCIe 40 GB с 40 Гб HBM2e и 6 912 ядрами.

Загружаемся...

Оценка производительности

H200 H200
MI325X MI325X
A100 A100

AMD Radeon Instinct MI355X

AMD Radeon Instinct MI355X

RX 7900 XTX RX 7900 XTX
Instinct MI300X Instinct MI300X
MI250 MI250

NVIDIA A100 PCIe 40 GB

NVIDIA A100 PCIe 40 GB

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

288 GB 40 GB

Тип памяти

HBM3e HBM2e

Пропускная способность памяти

8.19 TB/s 1.56 TB/s

Ширина шины памяти

8 192 бит 5 120 бит

ML-производительность

FP16 (half)

629,1 TFLOPS 77,97 TFLOPS

BF16

Нет 311,84 TFLOPS

TF32

Нет 155,92

Вычислительная мощность

FP32 (float)

78,64 TFLOPS 19,49 TFLOPS

FP64 (double)

78,64 TFLOPS 9,746 TFLOPS

CUDA ядра

16 384 6 912

RT ядра

Нет Нет

Архитектура и совместимость

Архитектура GPU

CDNA 4.0 Ampere

SM (Streaming Multiprocessor)

Нет 108

PCIe версия

PCIe 5.0 x16 PCIe 4.0 x16

Программная поддержка ML

CUDA версия

Нет 8.0

Частоты и производительность

Base Clock

1 000 765

Boost Clock

2 400 1 410

Memory Clock

2 000 1 215

Энергопотребление

TDP/TGP

1400 W
🔥 -82% 250 W

Рекомендуемый БП

1800 W
🔥 -67% 600 W

Разъём питания

None 8-pin EPS

Рендеринг

Текстурные блоки (TMU)

1 024 432

ROP

Нет Нет

L2 Cache

32 MB 40 MB

Бенчмарки

MLPerf, llama2-70b-99.9 (mxfp4)

10 129 tokens/s

MLPerf, llama3.1-405b (mxfp4)

252.4 tokens/s

Дополнительно

Слоты

OAM Module Dual-slot

Дата выпуска

12 марта 2025 г. 22 июня 2020 г.

Дисплейные порты

No outputs
No outputs

Арендовать дешевле, чем покупать