AMD EPYC Turin AI/ML Tuning Guide

AMD EPYC 9655P following AMD tuning guide for AI/ML workloads - https://www.amd.com/content/dam/amd/en/documents/epyc-technical-docs/tuning-guides/58467_amd-epyc-9005-tg-bios-and-workload.pdf Benchmarks by Michael Larabel for a future article.

HTML result view exported from: https://openbenchmarking.org/result/2411286-NE-AMDEPYCTU24&sro&grw.

LiteRT

Model: Mobilenet Float

LiteRT

Model: NASNet Mobile

LiteRT

Model: SqueezeNet

LiteRT

Model: Inception V4

OpenVINO GenAI

Model: Phi-3-mini-128k-instruct-int4-ov - Device: CPU

OpenVINO GenAI

Model: Falcon-7b-instruct-int4-ov - Device: CPU

OpenVINO GenAI

Model: Gemma-7b-int4-ov - Device: CPU

Whisperfile

Model Size: Tiny

Whisperfile

Model Size: Small

Whisperfile

Model Size: Medium

TensorFlow

Device: CPU - Batch Size: 256 - Model: ResNet-50

TensorFlow

Device: CPU - Batch Size: 512 - Model: ResNet-50

Numpy Benchmark

ONNX Runtime

Model: ResNet50 v1-12-int8 - Device: CPU - Executor: Standard

ONNX Runtime

Model: ResNet101_DUC_HDC-12 - Device: CPU - Executor: Standard

PyTorch

Device: CPU - Batch Size: 256 - Model: ResNet-50

PyTorch

Device: CPU - Batch Size: 256 - Model: ResNet-152

PyTorch

Device: CPU - Batch Size: 512 - Model: ResNet-50

PyTorch

Device: CPU - Batch Size: 512 - Model: ResNet-152

Whisper.cpp

Model: ggml-small.en - Input: 2016 State of the Union

Whisper.cpp

Model: ggml-medium.en - Input: 2016 State of the Union

XNNPACK

Model: FP32MobileNetV1

XNNPACK

Model: FP32MobileNetV2

XNNPACK

Model: FP32MobileNetV3Small

XNNPACK

Model: FP16MobileNetV1

XNNPACK

Model: FP16MobileNetV2

XNNPACK

Model: FP16MobileNetV3Small

XNNPACK

Model: QS8MobileNetV2

Llama.cpp

Backend: CPU BLAS - Model: Llama-3.1-Tulu-3-8B-Q8_0 - Test: Text Generation 128

Llama.cpp

Backend: CPU BLAS - Model: Llama-3.1-Tulu-3-8B-Q8_0 - Test: Prompt Processing 512

Llama.cpp

Backend: CPU BLAS - Model: Llama-3.1-Tulu-3-8B-Q8_0 - Test: Prompt Processing 1024

Llama.cpp

Backend: CPU BLAS - Model: Llama-3.1-Tulu-3-8B-Q8_0 - Test: Prompt Processing 2048

Llama.cpp

Backend: CPU BLAS - Model: granite-3.0-3b-a800m-instruct-Q8_0 - Test: Text Generation 128

Llama.cpp

Backend: CPU BLAS - Model: granite-3.0-3b-a800m-instruct-Q8_0 - Test: Prompt Processing 512

Llama.cpp

Backend: CPU BLAS - Model: granite-3.0-3b-a800m-instruct-Q8_0 - Test: Prompt Processing 2048

Llama.cpp

Backend: CPU BLAS - Model: Mistral-7B-Instruct-v0.3-Q8_0 - Test: Text Generation 128

Llama.cpp

Backend: CPU BLAS - Model: Mistral-7B-Instruct-v0.3-Q8_0 - Test: Prompt Processing 512

Llama.cpp

Backend: CPU BLAS - Model: Mistral-7B-Instruct-v0.3-Q8_0 - Test: Prompt Processing 1024

Llama.cpp

Backend: CPU BLAS - Model: Mistral-7B-Instruct-v0.3-Q8_0 - Test: Prompt Processing 2048

oneDNN

Harness: Convolution Batch Shapes Auto - Engine: CPU

oneDNN

Harness: Deconvolution Batch shapes_1d - Engine: CPU

oneDNN

Harness: Deconvolution Batch shapes_3d - Engine: CPU

oneDNN

Harness: IP Shapes 1D - Engine: CPU

oneDNN

Harness: IP Shapes 3D - Engine: CPU

oneDNN

Harness: Recurrent Neural Network Training - Engine: CPU

oneDNN

Harness: Recurrent Neural Network Inference - Engine: CPU

OpenVINO

Model: Age Gender Recognition Retail 0013 FP16 - Device: CPU

OpenVINO

Model: Age Gender Recognition Retail 0013 FP16 - Device: CPU

OpenVINO

Model: Person Detection FP16 - Device: CPU

OpenVINO

Model: Person Detection FP16 - Device: CPU

OpenVINO

Model: Weld Porosity Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Weld Porosity Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Vehicle Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Vehicle Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Person Vehicle Bike Detection FP16 - Device: CPU

OpenVINO

Model: Person Vehicle Bike Detection FP16 - Device: CPU

OpenVINO

Model: Machine Translation EN To DE FP16 - Device: CPU

OpenVINO

Model: Machine Translation EN To DE FP16 - Device: CPU

OpenVINO

Model: Face Detection Retail FP16-INT8 - Device: CPU

OpenVINO

Model: Face Detection Retail FP16-INT8 - Device: CPU

OpenVINO

Model: Handwritten English Recognition FP16-INT8 - Device: CPU

OpenVINO

Model: Handwritten English Recognition FP16-INT8 - Device: CPU

OpenVINO

Model: Road Segmentation ADAS FP16-INT8 - Device: CPU

OpenVINO

Model: Road Segmentation ADAS FP16-INT8 - Device: CPU

OpenVINO

Model: Person Re-Identification Retail FP16 - Device: CPU

OpenVINO

Model: Person Re-Identification Retail FP16 - Device: CPU

OpenVINO

Model: Noise Suppression Poconet-Like FP16 - Device: CPU

OpenVINO

Model: Noise Suppression Poconet-Like FP16 - Device: CPU

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO GenAI

CPU Power Consumption Monitor

OpenVINO GenAI

System Power Consumption Monitor

OpenVINO GenAI

CPU Power Consumption Monitor

OpenVINO GenAI

System Power Consumption Monitor

OpenVINO GenAI

CPU Power Consumption Monitor

OpenVINO GenAI

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Whisperfile

CPU Power Consumption Monitor

Whisperfile

System Power Consumption Monitor

Whisperfile

CPU Power Consumption Monitor

Whisperfile

System Power Consumption Monitor

Whisperfile

CPU Power Consumption Monitor

Whisperfile

System Power Consumption Monitor

Whisper.cpp

CPU Power Consumption Monitor

Whisper.cpp

System Power Consumption Monitor

Whisper.cpp

CPU Power Consumption Monitor

Whisper.cpp

System Power Consumption Monitor

TensorFlow

CPU Power Consumption Monitor

TensorFlow

System Power Consumption Monitor

TensorFlow

CPU Power Consumption Monitor

TensorFlow

System Power Consumption Monitor

LiteRT

CPU Power Consumption Monitor

LiteRT

System Power Consumption Monitor

LiteRT

CPU Power Consumption Monitor

LiteRT

System Power Consumption Monitor

LiteRT

CPU Power Consumption Monitor

LiteRT

System Power Consumption Monitor

LiteRT

CPU Power Consumption Monitor

LiteRT

System Power Consumption Monitor

PyTorch

CPU Power Consumption Monitor

PyTorch

System Power Consumption Monitor

PyTorch

CPU Power Consumption Monitor

PyTorch

System Power Consumption Monitor

PyTorch

CPU Power Consumption Monitor

PyTorch

System Power Consumption Monitor

PyTorch

CPU Power Consumption Monitor

PyTorch

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

Numpy Benchmark

CPU Power Consumption Monitor

Numpy Benchmark

System Power Consumption Monitor

ONNX Runtime

CPU Power Consumption Monitor

ONNX Runtime

System Power Consumption Monitor

ONNX Runtime

CPU Power Consumption Monitor

ONNX Runtime

System Power Consumption Monitor

XNNPACK

CPU Power Consumption Monitor

XNNPACK

System Power Consumption Monitor

OpenVINO GenAI

Model: Phi-3-mini-128k-instruct-int4-ov - Device: CPU - Time To First Token

OpenVINO GenAI

Model: Phi-3-mini-128k-instruct-int4-ov - Device: CPU - Time Per Output Token

OpenVINO GenAI

Model: Falcon-7b-instruct-int4-ov - Device: CPU - Time To First Token

OpenVINO GenAI

Model: Falcon-7b-instruct-int4-ov - Device: CPU - Time Per Output Token

OpenVINO GenAI

Model: Gemma-7b-int4-ov - Device: CPU - Time To First Token

OpenVINO GenAI

Model: Gemma-7b-int4-ov - Device: CPU - Time Per Output Token

ONNX Runtime

Model: ResNet50 v1-12-int8 - Device: CPU - Executor: Standard

ONNX Runtime

Model: ResNet101_DUC_HDC-12 - Device: CPU - Executor: Standard

Phoronix Test Suite v10.8.5