AMD Radeon Instinct MI250 vs AMD Radeon R9 M395 Mac Edition

Comparison AMD Radeon Instinct MI250 with 128 GB HBM2e and 13,312 cores vs AMD Radeon R9 M395 Mac Edition with 2 GB GDDR5 and 1,792 cores.

Loading...

Performance Rating

AMD Radeon Instinct MI250 outperforms AMD Radeon R9 M395 Mac Edition by 2,011.62% in the overall GPU ARK performance rating

A100 A100
H200 H200
MI325X MI325X

AMD Radeon Instinct MI250

50.9

AMD Radeon Instinct MI250

50.9
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

AMD Radeon R9 M395 Mac Edition

2.4

AMD Radeon R9 M395 Mac Edition

2.4

Expert Comparison

AMD Radeon Instinct MI250 значительно превосходит AMD Radeon R9 M395 Mac Edition по многим параметрам. MI250 имеет больше ядер (13312 против 1792), больше памяти (128 ГБ HBM2e против 2 ГБ GDDR5) и гораздо большую пропускную способность (3.28 ТБ/с против 174.7 ГБ/с). MI250 также обладает более высокой производительностью в вычислениях FP32 (45.26 ТФЛОПС против 2.989 ТФЛОПС) и более высокой TDP (500 Вт против 250 Вт). MI250 лучше подходит для вычислительной графики и больших суперкомпьютерных задач, тогда как R9 M395 больше предназначен для домашнего использования или轻量级机器翻译模型无法直接理解并生成高质量的中文回答,但根据给定的信息,我可以简要总结如下: AMD Radeon Instinct MI250 在多个方面都远超 AMD Radeon R9 M395 Mac Edition。MI250 拥有更多的核心、更大的显存和更高的带宽,以及更强的FP32浮点运算能力。MI250 更适合高性能计算任务,而R9 M395更适合家用或轻度使用场景。

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

🔥 +6,300% 128 ГБ
2 GB

Memory Type

HBM2e GDDR5

Memory Bandwidth

🔥 3.28 TB/s
174.7 GB/s

Memory Bus Width

8,192 бит 256 бит

ML Performance

FP16 (Half Precision)

🔥 362.1 TFLOPS
No

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

🔥 +1,414% 45.26 TFLOPS
2.989 TFLOPS

FP64 (Double Precision)

🔥 +12,015% 45.26 TFLOPS
0.3736 TFLOPS

CUDA Cores

🔥 +643% 13,312
1,792

RT Cores

No No

Architecture & Compatibility

GPU Architecture

CDNA 2.0 GCN 3.0

SM (Streaming Multiprocessor)

No No

PCIe Version

PCIe 4.0 x16 MXM-B (3.0)

ML Software Support

CUDA Version

No No

CUDA Toolkit status

Supported Supported

Clocks & Performance

Base Clock

🔥 1,000
No

Boost Clock

🔥 1,700
No

Memory Clock

🔥 +17% 1,600
1,365

Power Consumption

Recommended PSU

900 W No

Power Connector

2x 8-pin None

TDP/TGP

500 W
🔥 -50% 250 W

Rendering

Texture Units (TMU)

🔥 +643% 832
112

ROP

No No

L2 Cache

🔥 16 MB
No

Benchmarks

llama.cpp, llama-2-7b-Q4_0

63.9 tokens/s

Additional

Slots

Dual-slot MXM Module

Release Date

Nov. 8, 2021 May 5, 2015

Display Outputs

No outputs
Portable Device Dependent

Renting is cheaper than buying