AMD Radeon Instinct MI300X vs AMD Radeon Pro Vega 64X

Comparison of AMD Radeon Instinct MI300X with 192 GB HBM3 and 19,456 cores vs AMD Radeon Pro Vega 64X with 16 GB HBM2 and 4,096 cores.

Loading...

Performance Rating

AMD Radeon Instinct MI300X outperforms AMD Radeon Pro Vega 64X by 772.1% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

AMD Radeon Instinct MI300X

94.1

AMD Radeon Instinct MI300X

94.1
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

AMD Radeon Pro Vega 64X

10.8

AMD Radeon Pro Vega 64X

10.8

Expert Comparison

AMD Radeon Instinct MI300X значительно превосходит Radeon Pro Vega 64X по большинству параметров: имеет больше ядер, больший объем памяти (192 ГБ против 16 ГБ), более высокую пропускную способность (10.3 ТБ/с против 512 ГБ/с) и значительно большую производительность в FP32 (81.72 ТФЛОПС против 12.03 ТФЛОПС). MI300X также потребляет больше энергии (750 Вт против 250 Вт) и имеет более высокий GPI (94.1 против 10.8), что делает его предпочтительным выбором для вычислительных задач и машинного обучения. Radeon Pro Vega 64X больше подходит для графических задач и менее требовательных вычислений.

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

🔥 +1,100% 192 ГБ
16 GB

Memory Type

HBM3 HBM2

Memory Bandwidth

🔥 10.3 TB/s
512.0 GB/s

Memory Bus Width

8,192 бит 2,048 бит

ML Performance

FP16 (Half Precision)

🔥 +2,618% 653.7 TFLOPS
24.05 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

🔥 +579% 81.72 TFLOPS
12.03 TFLOPS

FP64 (Double Precision)

🔥 +10,773% 81.72 TFLOPS
0.7516 TFLOPS

CUDA Cores

🔥 +375% 19,456
4,096

RT Cores

No No

Architecture & Compatibility

GPU Architecture

CDNA 3.0 GCN 5.0

SM (Streaming Multiprocessor)

No No

PCIe Version

PCIe 5.0 x16 PCIe 3.0 x16

ML Software Support

CUDA Version

No No

Clocks & Performance

Base Clock

🔥 1,000
1,250

Boost Clock

🔥 +43% 2,100
1,468

Memory Clock

🔥 +152% 2,525
1,000

Power Consumption

Recommended PSU

1150 W No

Power Connector

None None

TDP/TGP

750 W
🔥 -67% 250 W

Rendering

Texture Units (TMU)

🔥 +375% 1,216
256

ROP

No No

L2 Cache

🔥 +300% 16 MB
4 MB

Benchmarks

MLPerf, llama2-70b-99.9 (UNSET)

1 983 tokens/s

MLPerf, llama2-70b-99.9 (fp16)

1 740 tokens/s

MLPerf, llama2-70b-99.9 (fp8)

1 057 tokens/s

MLPerf, llama3.1-405b (UNSET)

30.4 tokens/s

MLPerf, llama3.1-405b (fp16)

34.8 tokens/s

llama.cpp, llama-2-7b-Q4_0

232.9 tokens/s

MLPerf, mixtral-8x7b (fp8)

5 975 tokens/s

Additional

Slots

OAM Module IGP

Release Date

Dec. 6, 2023 March 19, 2019

Display Outputs

No outputs
Portable Device Dependent

Renting is cheaper than buying