Оценка производительности
AMD Radeon Instinct MI300X опережает NVIDIA L40S на 157,74% в суммарном рейтинге производительности GPU ARK
NVIDIA L40S
Экспертное сравнение
AMD Radeon Instinct MI300X имеет значительное преимущество в пропускной способности памяти (10.3 TB/s против 864.0 GB/s) и общем объеме памяти (192 ГБ HBM3 против 48 ГБ GDDR6), что делает его более подходящим для вычислений с большими данными и глубокого обучения. Его TDP в 750 Вт также выше, что указывает на большую мощность. В то время как NVIDIA L40S с архитектурой Ada Lovelace и высокой FP32 производительностью (91.61 TFLOPS) подходит для графических задач и менее требовательных вычислительных задач, он значительно уступает по памяти и пропускной способности памяти по сравнению с MI300X.
Содержание:
Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки ДополнительноПамять
Объем памяти
Тип памяти
Пропускная способность памяти
Ширина шины памяти
ML-производительность
FP16 (half)
BF16
TF32
Вычислительная мощность
FP32 (float)
FP64 (double)
CUDA ядра
RT ядра
Архитектура и совместимость
Архитектура GPU
SM (Streaming Multiprocessor)
PCIe версия
Программная поддержка ML
CUDA версия
Частоты и производительность
Base Clock
Boost Clock
Memory Clock
Энергопотребление
Рекомендуемый БП
Разъём питания
TDP/TGP
Рендеринг
Текстурные блоки (TMU)
ROP
L2 Cache
Бенчмарки
MLPerf, llama2-70b-99.9 (UNSET)
MLPerf, llama2-70b-99.9 (fp16)
MLPerf, llama2-70b-99.9 (fp8)
MLPerf, llama3.1-405b (UNSET)
MLPerf, llama3.1-405b (fp16)
llama.cpp, llama-2-7b-Q4_0
MLPerf, mixtral-8x7b (fp8)
Дополнительно
Слоты
Дата выпуска
Дисплейные порты
Арендовать дешевле, чем покупать