NVIDIA L40S vs NVIDIA RTX PRO 4000 Blackwell SFF

Сравнение NVIDIA L40S с 48 Гб GDDR6 и 18 176 ядрами против NVIDIA RTX PRO 4000 Blackwell SFF с 24 Гб GDDR7 и 8 960 ядрами.

Загружаемся...

Оценка производительности

NVIDIA L40S опережает NVIDIA RTX PRO 4000 Blackwell SFF на 175,13% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA L40S

36,5

NVIDIA L40S

36,5
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA RTX PRO 4000 Blackwell SFF

13,3

NVIDIA RTX PRO 4000 Blackwell SFF

13,3

Экспертное сравнение

NVIDIA L40S имеет значительно большую производительность благодаря более высокому количеству ядер, большей памяти и пропускной способности. Он лучше подходит для тяжелых задач, таких как профессиональное моделирование, машинное обучение и высокопроизводительное вычисление. В то время как NVIDIA RTX PRO 4000 Blackwell SFF более энергоэффективный и экономичный вариант с меньшими ресурсами, он лучше подходит для менее требовательных задач, таких как базовое моделирование и обучения небольших моделей.

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Дополнительно

Память

Объем памяти

🔥 +100% 48 ГБ
24 GB

Тип памяти

GDDR6 GDDR7

Пропускная способность памяти

864.0 GB/s 432.0 GB/s

Ширина шины памяти

384 бит 192 бит

ML-производительность

FP16 (half)

🔥 +257% 91,61 TFLOPS
25,66 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

🔥 +257% 91,61 TFLOPS
25,66 TFLOPS

FP64 (double)

🔥 +257% 1,4314 TFLOPS
0,401 TFLOPS

CUDA ядра

🔥 +103% 18 176
8 960

RT ядра

🔥 +103% 142
70

Архитектура и совместимость

Архитектура GPU

Ada Lovelace Blackwell 2.0

SM (Streaming Multiprocessor)

🔥 +103% 142
70

PCIe версия

PCIe 4.0 x16 PCIe 5.0 x8

Программная поддержка ML

CUDA версия

8.9
🔥 12.0

CUDA Toolkit (начало поддержки)

v11 v12

Статус CUDA Toolkit

Поддерживается Поддерживается

Частоты и производительность

Base Clock

🔥 +85% 1 065
577

Boost Clock

🔥 +76% 2 520
1 432

Memory Clock

🔥 +100% 2 250
1 125

Энергопотребление

Рекомендуемый БП

750 W
🔥 -67% 250 W

Разъём питания

1x 16-pin None

TDP/TGP

350 W
🔥 -80% 70 W

Рендеринг

Текстурные блоки (TMU)

🔥 +103% 568
280

ROP

🔥 +103% 142
70

L2 Cache

48 MB 48 MB

Дополнительно

Слоты

Dual-slot Dual-slot

Дата выпуска

13 октября 2022 г. 11 августа 2025 г.

Дисплейные порты

1x HDMI 2.1
3x DisplayPort 1.4a
4x mini-DisplayPort 2.1b

Арендовать дешевле, чем покупать