NVIDIA A800 SXM4 80 GB vs NVIDIA L40S

Сравнение NVIDIA A800 SXM4 80 GB с 80 Гб HBM2e и 6 912 ядрами против NVIDIA L40S с 48 Гб GDDR6 и 18 176 ядрами.

Загружаемся...

Оценка производительности

NVIDIA L40S опережает NVIDIA A800 SXM4 80 GB на 41,02% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA A800 SXM4 80 GB

25,9

NVIDIA A800 SXM4 80 GB

25,9
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA L40S

36,5

NVIDIA L40S

36,5

Экспертное сравнение

NVIDIA A800 SXM4 80 GB имеет больше памяти (80 ГБ HBM2e) и большую пропускную способность (2.04 TB/s), что делает его лучше для вычислительных задач, требующих обработки больших объемов данных. В то же время, NVIDIA L40S с архитектурой Ada Lovelace и 91.61 TFLOPS FP32 производительности, а также более высокой базовой и буст-частотой, лучше подходит для игр и графических задач благодаря своей более высокой пропускной способности (864.0 GB/s) и большему количеству ядер (18176).

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Дополнительно

Память

Объем памяти

🔥 +67% 80 ГБ
48 GB

Тип памяти

HBM2e GDDR6

Пропускная способность памяти

🔥 2.04 TB/s
864.0 GB/s

Ширина шины памяти

5 120 бит 384 бит

ML-производительность

FP16 (half)

77,97 TFLOPS
🔥 +17% 91,61 TFLOPS

BF16

🔥 311,84 TFLOPS
Нет

TF32

🔥 155,92
Нет

Вычислительная мощность

FP32 (float)

19,49 TFLOPS
🔥 +370% 91,61 TFLOPS

FP64 (double)

🔥 +581% 9,746 TFLOPS
1,4314 TFLOPS

CUDA ядра

6 912
🔥 +163% 18 176

RT ядра

Нет
🔥 142

Архитектура и совместимость

Архитектура GPU

Ampere Ada Lovelace

SM (Streaming Multiprocessor)

108
🔥 +31% 142

PCIe версия

PCIe 4.0 x16 PCIe 4.0 x16

Программная поддержка ML

CUDA версия

8.0
🔥 8.9

CUDA Toolkit (начало поддержки)

v11 v11

Статус CUDA Toolkit

Поддерживается Поддерживается

Частоты и производительность

Base Clock

🔥 +8% 1 155
1 065

Boost Clock

1 410
🔥 +79% 2 520

Memory Clock

1 593
🔥 +41% 2 250

Энергопотребление

Рекомендуемый БП

800 W
🔥 -6% 750 W

Разъём питания

None 1x 16-pin

TDP/TGP

400 W
🔥 -12% 350 W

Рендеринг

Текстурные блоки (TMU)

432
🔥 +31% 568

ROP

Нет
🔥 142

L2 Cache

40 MB
🔥 +20% 48 MB

Дополнительно

Слоты

🔥 SXM Module
Dual-slot

Дата выпуска

11 августа 2022 г. 13 октября 2022 г.

Дисплейные порты

No outputs
1x HDMI 2.1
3x DisplayPort 1.4a

Арендовать дешевле, чем покупать