AMD Radeon Instinct MI300X vs NVIDIA NVS 810

Contents:

Memory ML Performance Compute Power Architecture & Compatibility ML Software Support Clocks & Performance Power Consumption Rendering Benchmarks Additional

Memory

Memory Size

+9,500% 192 ГБ

2 GB ×2 (4 ГБ)

Memory Type

HBM3 DDR3

Memory Bandwidth

10.3 TB/s

14.40 GB/s ×2 (28.8 GB/s)

Memory Bus Width

8,192 бит 64 бит ×2 (128 бит)

ML Performance

FP16 (Half Precision)

653.7 TFLOPS

BF16 (Brain Float)

No No

TF32 (TensorFloat)

No No

Compute Power

FP32 (Single Precision)

+7,625% 81.72 TFLOPS

1.0578 TFLOPS

FP64 (Double Precision)

+246,788% 81.72 TFLOPS

0.0331 TFLOPS

CUDA Cores

+3,700% 19,456

512 ×2 (1024)

RT Cores

No No

Architecture & Compatibility

GPU Architecture

CDNA 3.0 Maxwell

SM (Streaming Multiprocessor)

No No

PCIe Version

PCIe 5.0 x16 PCIe 3.0 x16

ML Software Support

CUDA Version

No 5.0

CUDA Toolkit (first supported)

— v6

CUDA Toolkit (deprecated)

— v12

CUDA Toolkit (support removed)

— v13

CUDA Toolkit status

Supported Removed

Clocks & Performance

Base Clock

+11% 1,000

902

Boost Clock

+103% 2,100

1,033

Memory Clock

+181% 2,525

900

Power Consumption

Recommended PSU

1150 W

-78% 250 W

Power Connector

None None

TDP/TGP

750 W

-91% 68 W

Rendering

Texture Units (TMU)

+3,700% 1,216

32 ×2 (64)

ROP

No No

L2 Cache

16 MB

1024 KB

Benchmarks

MLPerf, llama2-70b-99.9 (UNSET)

1 983 tokens/s —

MLPerf, llama2-70b-99.9 (fp16)

1 740 tokens/s —

MLPerf, llama2-70b-99.9 (fp8)

1 057 tokens/s —

MLPerf, llama3.1-405b (UNSET)

30.4 tokens/s —

MLPerf, llama3.1-405b (fp16)

34.8 tokens/s —

llama.cpp, llama-2-7b-Q4_0

232.9 tokens/s —

MLPerf, mixtral-8x7b (fp8)

5 975 tokens/s —

Additional

Slots

OAM Module Single-slot

Release Date

Dec. 6, 2023 Nov. 4, 2015

Display Outputs

No outputs

8x mini-DisplayPort 1.2

Renting is cheaper than buying

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

from 375.0 RUB/hour

Rent

Details

H100 80Gb PCIe (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

from 299.11 RUB/hour

Rent

Details

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

from 299.11 RUB/hour

Rent

Details

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

from 200.89 RUB/hour

Rent

Details

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

from 81.85 RUB/hour

Rent

Details

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

from 34.23 RUB/hour

Rent

Details

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

from 31.25 RUB/hour

Rent

Details

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

from 26.79 RUB/hour

Rent

Details

AMD Radeon Instinct MI300X vs NVIDIA NVS 810

Comparison AMD Radeon Instinct MI300X with 192 GB HBM3 and 19,456 cores vs NVIDIA NVS 810 with 2 GB DDR3 and 512 cores.