AMD EPYC Turin 2025 New AVX-512 Benchmarks

AMD EPYC 9655P AVX-512 on/off benchmarks by Michael Larabel for a future article.

EPYC Turin: AVX-512 Enabled

Kernel Notes: Transparent Huge Pages: madvise
Environment Notes: CXXFLAGS="-O3 -march=znver5 -mprefer-vector-width=512 -flto" CFLAGS="-O3 -march=znver5 -mprefer-vector-width=512 -flto"
Compiler Notes: --build=x86_64-linux-gnu --disable-vtable-verify --disable-werror --enable-bootstrap --enable-cet --enable-checking=release --enable-clocale=gnu --enable-default-pie --enable-gnu-unique-object --enable-languages=c,ada,c++,go,d,fortran,objc,obj-c++,m2,rust --enable-libphobos-checking=release --enable-libstdcxx-backtrace --enable-libstdcxx-debug --enable-libstdcxx-time=yes --enable-link-serialization=2 --enable-multiarch --enable-multilib --enable-nls --enable-objc-gc=auto --enable-offload-defaulted --enable-offload-targets=nvptx-none=/build/gcc-14-zdkDXv/gcc-14-14.2.0/debian/tmp-nvptx/usr,amdgcn-amdhsa=/build/gcc-14-zdkDXv/gcc-14-14.2.0/debian/tmp-gcn/usr --enable-plugin --enable-shared --enable-threads=posix --host=x86_64-linux-gnu --program-prefix=x86_64-linux-gnu- --target=x86_64-linux-gnu --with-abi=m64 --with-arch-32=i686 --with-build-config=bootstrap-lto-lean --with-default-libstdcxx-abi=new --with-gcc-major-version-only --with-multilib-list=m32,m64,mx32 --with-target-system-zlib=auto --with-tune=generic --without-cuda-driver -v
Processor Notes: Scaling Governor: acpi-cpufreq performance (Boost: Enabled) - CPU Microcode: 0xb002116
Python Notes: Python 3.12.7
Security Notes: gather_data_sampling: Not affected + itlb_multihit: Not affected + l1tf: Not affected + mds: Not affected + meltdown: Not affected + mmio_stale_data: Not affected + reg_file_data_sampling: Not affected + retbleed: Not affected + spec_rstack_overflow: Not affected + spec_store_bypass: Mitigation of SSB disabled via prctl + spectre_v1: Mitigation of usercopy/swapgs barriers and __user pointer sanitization + spectre_v2: Mitigation of Enhanced / Automatic IBRS; IBPB: conditional; STIBP: always-on; RSB filling; PBRSB-eIBRS: Not affected; BHI: Not affected + srbds: Not affected + tsx_async_abort: Not affected

EPYC Turin: AVX-512 Disabled

Processor: AMD EPYC 9655P 96-Core @ 2.60GHz (96 Cores / 192 Threads), Motherboard: Supermicro Super Server H13SSL-N v1.01 (3.0 BIOS), Chipset: AMD 1Ah, Memory: 12 x 64GB DDR5-6000MT/s Micron MTC40F2046S1RC64BDY QSFF, Disk: 3201GB Micron_7450_MTFDKCB3T2TFS, Graphics: ASPEED, Network: 2 x Broadcom NetXtreme BCM5720 PCIe

OS: Ubuntu 24.10, Kernel: 6.13.0-rc4-phx-stock (x86_64), Desktop: GNOME Shell 47.0, Display Server: X Server, Compiler: GCC 14.2.0, File-System: ext4, Screen Resolution: 1024x768

miniBUDE

MiniBUDE is a mini application for the the core computation of the Bristol University Docking Engine (BUDE). This test profile currently makes use of the OpenMP implementation of miniBUDE for CPU benchmarking. Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

GROMACS

The GROMACS (GROningen MAchine for Chemical Simulations) molecular dynamics package testing with the water_GMX50 data. This test profile allows selecting between CPU and GPU-based GROMACS builds. Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

ACES DGEMM

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Laghos

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Embree

Intel Embree is a collection of high-performance ray-tracing kernels for execution on CPUs (and GPUs via SYCL) and supporting instruction sets such as SSE, AVX, AVX2, and AVX-512. Embree also supports making use of the Intel SPMD Program Compiler (ISPC). Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

OpenVKL

OpenVKL is the Intel Open Volume Kernel Library that offers high-performance volume computation kernels and part of the Intel oneAPI rendering toolkit. Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

OSPRay

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

OSPRay Studio

Intel OSPRay Studio is an open-source, interactive visualization and ray-tracing software package. OSPRay Studio makes use of Intel OSPRay, a portable ray-tracing engine for high-performance, high-fidelity visualizations. OSPRay builds off Intel's Embree and Intel SPMD Program Compiler (ISPC) components as part of the oneAPI rendering toolkit. Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Y-Cruncher

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Cpuminer-Opt

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

SMHasher

SMHasher is a hash function tester supporting various algorithms and able to make use of AVX and other modern CPU instruction set extensions. Learn more via the OpenBenchmarking.org test page.

Result

cycles/hash

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

oneDNN

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

PyTorch

This is a benchmark of PyTorch making use of pytorch-benchmark [https://github.com/LukasHedegaard/pytorch-benchmark]. Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

TensorFlow

This is a benchmark of the TensorFlow deep learning framework using the TensorFlow reference benchmarks (tensorflow/benchmarks with tf_cnn_benchmarks.py). Note with the Phoronix Test Suite there is also pts/tensorflow-lite for benchmarking the TensorFlow Lite binaries if desired for complementary metrics. Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

OpenVINO

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

OpenVINO GenAI

Result

Time To First Token

Time Per Output Token

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Llama.cpp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

ONNX Runtime

Result

Inference Time Cost (ms)

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

Inference Time Cost (ms)

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

Inference Time Cost (ms)

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

Inference Time Cost (ms)

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

Inference Time Cost (ms)

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

Inference Time Cost (ms)

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

Inference Time Cost (ms)

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

Inference Time Cost (ms)

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Numpy Benchmark

This is a test to obtain the general Numpy performance. Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

libxsmm

Libxsmm is an open-source library for specialized dense and sparse matrix operations and deep learning primitives. Libxsmm supports making use of Intel AMX, AVX-512, and other modern CPU instruction set capabilities. Learn more via the OpenBenchmarking.org test page.

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Mobile Neural Network

srsRAN Project

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

SVT-AV1

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

Result

CPU Peak Freq (Highest CPU Core Frequency

CPU Power Consumption

CPU Temp

87 Results Shown

EPYC Turin: AVX-512 Enabled

Testing initiated at 20 January 2025 01:39 by user phoronix.

EPYC Turin: AVX-512 Disabled

Testing initiated at 20 January 2025 20:10 by user phoronix.

AMD EPYC Turin 2025 New AVX-512 Benchmarks

View

Statistics

Graph Settings

Multi-Way Comparison

Table

Sensor Monitoring

Run Management

EPYC Turin: AVX-512 Enabled

EPYC Turin: AVX-512 Disabled

miniBUDE

GROMACS

ACES DGEMM

Laghos

Embree

OpenVKL

OSPRay

OSPRay Studio

Y-Cruncher

Cpuminer-Opt

SMHasher

oneDNN

PyTorch

TensorFlow

OpenVINO

OpenVINO GenAI

Llama.cpp

ONNX Runtime

Numpy Benchmark

libxsmm

Mobile Neural Network

srsRAN Project

SVT-AV1

87 Results Shown

EPYC Turin: AVX-512 Enabled

EPYC Turin: AVX-512 Disabled