AMD Radeon Instinct MI300X vs Point of View TGT GTX 590 Ultra Charged V2

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

192 ГБ

1 536 MB ×2 (3072 ГБ)

Тип памяти

HBM3 GDDR5

Пропускная способность памяти

10.3 TB/s

164.0 GB/s ×2 (328 GB/s)

Ширина шины памяти

8 192 бит 384 бит ×2 (768 бит)

ML-производительность

FP16 (half)

653,7 TFLOPS

Нет

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

+5 851% 81,72 TFLOPS

1,3732 TFLOPS

FP64 (double)

+47 522% 81,72 TFLOPS

0,1716 TFLOPS

CUDA ядра

+3 700% 19 456

512 ×2 (1024)

RT ядра

Нет Нет

Архитектура и совместимость

Архитектура GPU

CDNA 3.0 Fermi 2.0

SM (Streaming Multiprocessor)

Нет 16

PCIe версия

PCIe 5.0 x16 PCIe 2.0 x16

Программная поддержка ML

CUDA версия

Нет 2.0

Частоты и производительность

Base Clock

1 000

Нет

Boost Clock

2 100

Нет

Memory Clock

+196% 2 525

854

Энергопотребление

Рекомендуемый БП

1150 W

-35% 750 W

Разъём питания

None 2x 8-pin

TDP/TGP

750 W

-51% 365 W

Рендеринг

Текстурные блоки (TMU)

+1 800% 1 216

64 ×2 (128)

ROP

Нет Нет

L2 Cache

16 MB

768 KB

Бенчмарки

MLPerf, llama2-70b-99.9 (UNSET)

1 983 tokens/s —

MLPerf, llama2-70b-99.9 (fp16)

1 740 tokens/s —

MLPerf, llama2-70b-99.9 (fp8)

1 057 tokens/s —

MLPerf, llama3.1-405b (UNSET)

30.4 tokens/s —

MLPerf, llama3.1-405b (fp16)

34.8 tokens/s —

llama.cpp, llama-2-7b-Q4_0

232.9 tokens/s —

MLPerf, mixtral-8x7b (fp8)

5 975 tokens/s —

Дополнительно

Слоты

OAM Module Dual-slot

Дата выпуска

6 декабря 2023 г. 1 сентября 2011 г.

Дисплейные порты

No outputs

3x DVI
1x mini-DisplayPort

Арендовать дешевле, чем покупать

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

от 375,0 руб/час

Арендовать

Подробнее

H100 80Gb PCIe (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

от 200,89 руб/час

Арендовать

Подробнее

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

от 81,85 руб/час

Арендовать

Подробнее

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 34,23 руб/час

Арендовать

Подробнее

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 31,25 руб/час

Арендовать

Подробнее

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

от 26,79 руб/час

Арендовать

Подробнее

AMD Radeon Instinct MI300X vs Point of View TGT GTX 590 Ultra Charged V2

Сравнение AMD Radeon Instinct MI300X с 192 Гб HBM3 и 19 456 ядрами против Point of View TGT GTX 590 Ultra Charged V2 с 1 536 Гб GDDR5 и 512 ядрами.