AMD EPYC Turin AI/ML Tuning Guide Benchmarks

Stock

Kernel Notes: Transparent Huge Pages: madvise
Compiler Notes: --build=x86_64-linux-gnu --disable-vtable-verify --disable-werror --enable-bootstrap --enable-cet --enable-checking=release --enable-clocale=gnu --enable-default-pie --enable-gnu-unique-object --enable-languages=c,ada,c++,go,d,fortran,objc,obj-c++,m2,rust --enable-libphobos-checking=release --enable-libstdcxx-backtrace --enable-libstdcxx-debug --enable-libstdcxx-time=yes --enable-link-serialization=2 --enable-multiarch --enable-multilib --enable-nls --enable-objc-gc=auto --enable-offload-defaulted --enable-offload-targets=nvptx-none=/build/gcc-14-zdkDXv/gcc-14-14.2.0/debian/tmp-nvptx/usr,amdgcn-amdhsa=/build/gcc-14-zdkDXv/gcc-14-14.2.0/debian/tmp-gcn/usr --enable-plugin --enable-shared --enable-threads=posix --host=x86_64-linux-gnu --program-prefix=x86_64-linux-gnu- --target=x86_64-linux-gnu --with-abi=m64 --with-arch-32=i686 --with-build-config=bootstrap-lto-lean --with-default-libstdcxx-abi=new --with-gcc-major-version-only --with-multilib-list=m32,m64,mx32 --with-target-system-zlib=auto --with-tune=generic --without-cuda-driver -v
Processor Notes: Scaling Governor: acpi-cpufreq performance (Boost: Enabled) - CPU Microcode: 0xb002116
Python Notes: Python 3.12.7
Security Notes: gather_data_sampling: Not affected + itlb_multihit: Not affected + l1tf: Not affected + mds: Not affected + meltdown: Not affected + mmio_stale_data: Not affected + reg_file_data_sampling: Not affected + retbleed: Not affected + spec_rstack_overflow: Not affected + spec_store_bypass: Mitigation of SSB disabled via prctl + spectre_v1: Mitigation of usercopy/swapgs barriers and __user pointer sanitization + spectre_v2: Mitigation of Enhanced / Automatic IBRS; IBPB: conditional; STIBP: always-on; RSB filling; PBRSB-eIBRS: Not affected; BHI: Not affected + srbds: Not affected + tsx_async_abort: Not affected

Testing initiated at 28 November 2024 11:13 by user phoronix.

AI/ML Tuning Recommendations

Processor: AMD EPYC 9655P 96-Core @ 2.60GHz (96 Cores / 192 Threads), Motherboard: Supermicro Super Server H13SSL-N v1.01 (3.0 BIOS), Chipset: AMD 1Ah, Memory: 12 x 64GB DDR5-6000MT/s Micron MTC40F2046S1RC64BDY QSFF, Disk: 3201GB Micron_7450_MTFDKCB3T2TFS, Graphics: ASPEED, Network: 2 x Broadcom NetXtreme BCM5720 PCIe

OS: Ubuntu 24.10, Kernel: 6.12.0-rc7-linux-pm-next-phx (x86_64), Desktop: GNOME Shell 47.0, Display Server: X Server, Compiler: GCC 14.2.0, File-System: ext4, Screen Resolution: 1024x768

Testing initiated at 28 November 2024 17:10 by user phoronix.

AMD EPYC Turin AI/ML Tuning Guide

View

Statistics

Graph Settings

Multi-Way Comparison

Table

Sensor Monitoring

Run Management

Stock

AI/ML Tuning Recommendations

OpenVINO

Llama.cpp

OpenVINO

oneDNN

Llama.cpp

oneDNN

PyTorch

oneDNN

OpenVINO

Llama.cpp

PyTorch

oneDNN

Llama.cpp

OpenVINO

Llama.cpp

OpenVINO

oneDNN

OpenVINO

PyTorch

OpenVINO

ONNX Runtime

Whisper.cpp

Whisperfile

PyTorch

Llama.cpp

OpenVINO

XNNPACK

OpenVINO

LiteRT

XNNPACK

OpenVINO

TensorFlow

Whisperfile

LiteRT

XNNPACK

TensorFlow

OpenVINO GenAI

Whisperfile

Llama.cpp

Whisper.cpp

XNNPACK

Llama.cpp

oneDNN

XNNPACK

Llama.cpp

OpenVINO GenAI

Numpy Benchmark

OpenVINO GenAI

LiteRT

XNNPACK

ONNX Runtime

LiteRT

Llama.cpp

75 Results Shown

Stock

AI/ML Tuning Recommendations