AMD FirePro W9100 32 GB vs AMD Radeon Instinct MI325X

Comparison AMD FirePro W9100 32 GB with 32 GB GDDR5 and 2,816 cores vs AMD Radeon Instinct MI325X with 288 GB HBM3e and 19,456 cores.

Loading...

Performance Rating

AMD Radeon Instinct MI325X outperforms AMD FirePro W9100 32 GB by 1,563.89% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

AMD FirePro W9100 32 GB

6.0

AMD FirePro W9100 32 GB

6.0
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

AMD Radeon Instinct MI325X

100.0

AMD Radeon Instinct MI325X

100.0

Expert Comparison

AMD FirePro W9100 32 GB более старая модель с меньшим количеством ядер и меньшей пропускной способностью памяти, что делает её менее эффективной для современных задач, особенно требующих высокой параллельной вычислительной мощности. В то время как Radeon Instinct MI325X обладает значительно большей пропускной способностью памяти (10.3 TB/s против 320 GB/s) и большим количеством ядер (19456 против 2816), что делает её идеальной для вычислительных задач и больших данных. MI325X также имеет гораздо большую TDP (1000 Вт против 275 Вт), что указывает на её высокую энергетическую потребность и соответственно большую производительность.

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

32 GB
🔥 +800% 288 ГБ

Memory Type

GDDR5 HBM3e

Memory Bandwidth

320.0 GB/s
🔥 10.3 TB/s

Memory Bus Width

512 бит 8,192 бит

ML Performance

FP16 (Half Precision)

No
🔥 653.7 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

5.238 TFLOPS
🔥 +1,460% 81.72 TFLOPS

FP64 (Double Precision)

2.619 TFLOPS
🔥 +3,020% 81.72 TFLOPS

CUDA Cores

2,816
🔥 +591% 19,456

RT Cores

No No

Architecture & Compatibility

GPU Architecture

GCN 2.0 CDNA 3.0

SM (Streaming Multiprocessor)

No No

PCIe Version

PCIe 3.0 x16 PCIe 5.0 x16

ML Software Support

CUDA Version

No No

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

No
🔥 1,000

Boost Clock

No
🔥 2,100

Memory Clock

1,250
🔥 +102% 2,525

Power Consumption

Recommended PSU

🔥 -57% 600 W
1400 W

Power Connector

1x 6-pin + 1x 8-pin None

TDP/TGP

🔥 -72% 275 W
1000 W

Rendering

Texture Units (TMU)

176
🔥 +591% 1,216

ROP

No No

L2 Cache

1024 KB
🔥 16 MB

Benchmarks

MLPerf, llama2-70b-99.9 (Dummy)

3 596 tokens/s

MLPerf, llama2-70b-99.9 (fp8)

1 946 tokens/s

llama.cpp, llama-2-7b-Q4_0

22.4 tokens/s

MLPerf, mixtral-8x7b (fp8)

6 975 tokens/s

Additional

Slots

Dual-slot OAM Module

Release Date

March 26, 2014 Oct. 12, 2024

Display Outputs

6x mini-DisplayPort 1.2
1x S-Video
No outputs

Renting is cheaper than buying