NVIDIA Tesla M40

NVIDIA Tesla M40 — 12 Гб GDDR5, 3 072 ядер, GPI 5,7

Загружаемся...

Оценка производительности

GPU от NVIDIA на процессоре GM200. NVIDIA Tesla M40 содержит 12 Гб видеопамяти GDDR5. Шина 384 бит, пропускная способность 288.4 GB/s. NVIDIA Tesla M40 имеет 3072 CUDA ядра. 28 nm техпроцесс в TSMC. Выпущена 10.11.2015.

H200 H200
MI325X MI325X
A100 A100

NVIDIA Tesla M40

5,7

NVIDIA Tesla M40

5,7

Память

Объем памяти

12 ГБ

Тип памяти

Пропускная способность памяти

288.4 GB/s

Ширина шины памяти

384 бит
8 192 бит
(AMD Radeon Instinct MI325X)

ML-производительность

FP16 (half)

Нет TFLOPS
998,4 TFLOPS
(Intel UHD Graphics 730)

BF16

Нет TFLOPS
311,84 TFLOPS
(NVIDIA A800 SXM4 80 GB)

TF32

Нет

Вычислительная мощность

FP32 (float)

6,832 TFLOPS
1 425,0 TFLOPS
(Matrox D1480 Quad DisplayPort)

FP64 (double)

0,2135 TFLOPS
1 204 000,0 TFLOPS
(AMD Radeon RX 7900M)

CUDA ядра

RT ядра

Архитектура и совместимость

Архитектура GPU

Maxwell 2.0

SM (Streaming Multiprocessor)

PCIe версия

PCIe 3.0 x16

Программная поддержка ML

CUDA версия

Частоты и производительность

Base Clock

Boost Clock

Memory Clock

1 502

Энергопотребление

TDP/TGP

250 W
unknown
(NVIDIA CMP 70HX)

Рекомендуемый БП

Разъём питания

8-pin EPS

Рендеринг

Текстурные блоки (TMU)

Бенчмарки

llama.cpp, gpt-oss 20B Q4_K - Medium

47.0 tokens/s

llama.cpp, llama 7B Q4_0

36.7 tokens/s
315.3 tokens/s
(NVIDIA GeForce RTX 5090)

llama.cpp, llama-2-7b-Q4_0

41.7 tokens/s
280.7 tokens/s
(NVIDIA H100 SXM5 96 GB)

llama.cpp, qwen3 32B Q4_K - Medium

7.19 tokens/s

llama.cpp, qwen3moe 30B.A3B Q4_K - Medium

35.1 tokens/s

Дополнительно

Слоты

Dual-slot
SXM Module
(NVIDIA H200 SXM 141 GB)

Дата выпуска

10 ноября 2015 г.
17 июля 2025 г.
(NVIDIA GeForce RTX 5070 Ti SUPER)

Дисплейные порты

No outputs
4x mini-DisplayPort 2.0
4x HDMI 2.1
(SPARKLE Arc A310 OmniView)

Арендовать дешевле, чем покупать