AMD EPYC Turin AI/ML Tuning Guide

AMD EPYC 9655P following AMD tuning guide for AI/ML workloads - https://www.amd.com/content/dam/amd/en/documents/epyc-technical-docs/tuning-guides/58467_amd-epyc-9005-tg-bios-and-workload.pdf Benchmarks by Michael Larabel for a future article.

HTML result view exported from: https://openbenchmarking.org/result/2411286-NE-AMDEPYCTU24&sor&grs.

OpenVINO

Model: Weld Porosity Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Weld Porosity Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Person Vehicle Bike Detection FP16 - Device: CPU

Llama.cpp

Backend: CPU BLAS - Model: Mistral-7B-Instruct-v0.3-Q8_0 - Test: Prompt Processing 512

OpenVINO

Model: Person Vehicle Bike Detection FP16 - Device: CPU

OpenVINO

Model: Face Detection Retail FP16-INT8 - Device: CPU

OpenVINO

Model: Face Detection Retail FP16-INT8 - Device: CPU

oneDNN

Harness: Deconvolution Batch shapes_3d - Engine: CPU

oneDNN

Harness: Convolution Batch Shapes Auto - Engine: CPU

Llama.cpp

Backend: CPU BLAS - Model: Llama-3.1-Tulu-3-8B-Q8_0 - Test: Prompt Processing 2048

oneDNN

Harness: IP Shapes 1D - Engine: CPU

PyTorch

Device: CPU - Batch Size: 512 - Model: ResNet-152

oneDNN

Harness: Recurrent Neural Network Inference - Engine: CPU

OpenVINO

Model: Vehicle Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Vehicle Detection FP16-INT8 - Device: CPU

Llama.cpp

Backend: CPU BLAS - Model: Llama-3.1-Tulu-3-8B-Q8_0 - Test: Prompt Processing 1024

PyTorch

Device: CPU - Batch Size: 256 - Model: ResNet-152

oneDNN

Harness: Recurrent Neural Network Training - Engine: CPU

Llama.cpp

Backend: CPU BLAS - Model: Llama-3.1-Tulu-3-8B-Q8_0 - Test: Prompt Processing 512

OpenVINO

Model: Age Gender Recognition Retail 0013 FP16 - Device: CPU

Llama.cpp

Backend: CPU BLAS - Model: Mistral-7B-Instruct-v0.3-Q8_0 - Test: Prompt Processing 1024

OpenVINO

Model: Road Segmentation ADAS FP16-INT8 - Device: CPU

oneDNN

Harness: IP Shapes 3D - Engine: CPU

OpenVINO

Model: Road Segmentation ADAS FP16-INT8 - Device: CPU

OpenVINO

Model: Age Gender Recognition Retail 0013 FP16 - Device: CPU

PyTorch

Device: CPU - Batch Size: 512 - Model: ResNet-50

OpenVINO

Model: Machine Translation EN To DE FP16 - Device: CPU

OpenVINO

Model: Machine Translation EN To DE FP16 - Device: CPU

ONNX Runtime

Model: ResNet50 v1-12-int8 - Device: CPU - Executor: Standard

Whisper.cpp

Model: ggml-small.en - Input: 2016 State of the Union

Whisperfile

Model Size: Small

PyTorch

Device: CPU - Batch Size: 256 - Model: ResNet-50

Llama.cpp

Backend: CPU BLAS - Model: granite-3.0-3b-a800m-instruct-Q8_0 - Test: Text Generation 128

OpenVINO

Model: Person Re-Identification Retail FP16 - Device: CPU

XNNPACK

Model: FP16MobileNetV1

OpenVINO

Model: Person Re-Identification Retail FP16 - Device: CPU

OpenVINO

Model: Handwritten English Recognition FP16-INT8 - Device: CPU

OpenVINO

Model: Handwritten English Recognition FP16-INT8 - Device: CPU

LiteRT

Model: Mobilenet Float

XNNPACK

Model: QS8MobileNetV2

OpenVINO

Model: Noise Suppression Poconet-Like FP16 - Device: CPU

OpenVINO

Model: Noise Suppression Poconet-Like FP16 - Device: CPU

OpenVINO

Model: Person Detection FP16 - Device: CPU

OpenVINO

Model: Person Detection FP16 - Device: CPU

TensorFlow

Device: CPU - Batch Size: 512 - Model: ResNet-50

Whisperfile

Model Size: Medium

LiteRT

Model: SqueezeNet

XNNPACK

Model: FP32MobileNetV2

XNNPACK

Model: FP32MobileNetV1

TensorFlow

Device: CPU - Batch Size: 256 - Model: ResNet-50

OpenVINO GenAI

Model: Phi-3-mini-128k-instruct-int4-ov - Device: CPU

Whisperfile

Model Size: Tiny

Llama.cpp

Backend: CPU BLAS - Model: Mistral-7B-Instruct-v0.3-Q8_0 - Test: Text Generation 128

Llama.cpp

Backend: CPU BLAS - Model: Llama-3.1-Tulu-3-8B-Q8_0 - Test: Text Generation 128

Whisper.cpp

Model: ggml-medium.en - Input: 2016 State of the Union

XNNPACK

Model: FP32MobileNetV3Small

Llama.cpp

Backend: CPU BLAS - Model: Mistral-7B-Instruct-v0.3-Q8_0 - Test: Prompt Processing 2048

oneDNN

Harness: Deconvolution Batch shapes_1d - Engine: CPU

XNNPACK

Model: FP16MobileNetV2

Llama.cpp

Backend: CPU BLAS - Model: granite-3.0-3b-a800m-instruct-Q8_0 - Test: Prompt Processing 2048

OpenVINO GenAI

Model: Gemma-7b-int4-ov - Device: CPU

Numpy Benchmark

OpenVINO GenAI

Model: Falcon-7b-instruct-int4-ov - Device: CPU

LiteRT

Model: Inception V4

XNNPACK

System Power Consumption Monitor

XNNPACK

CPU Power Consumption Monitor

XNNPACK

Model: FP16MobileNetV3Small

ONNX Runtime

System Power Consumption Monitor

ONNX Runtime

CPU Power Consumption Monitor

ONNX Runtime

Model: ResNet101_DUC_HDC-12 - Device: CPU - Executor: Standard

ONNX Runtime

Model: ResNet101_DUC_HDC-12 - Device: CPU - Executor: Standard

ONNX Runtime

System Power Consumption Monitor

ONNX Runtime

CPU Power Consumption Monitor

ONNX Runtime

Model: ResNet50 v1-12-int8 - Device: CPU - Executor: Standard

Numpy Benchmark

System Power Consumption Monitor

Numpy Benchmark

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

oneDNN

System Power Consumption Monitor

oneDNN

CPU Power Consumption Monitor

PyTorch

System Power Consumption Monitor

PyTorch

CPU Power Consumption Monitor

PyTorch

System Power Consumption Monitor

PyTorch

CPU Power Consumption Monitor

PyTorch

System Power Consumption Monitor

PyTorch

CPU Power Consumption Monitor

PyTorch

System Power Consumption Monitor

PyTorch

CPU Power Consumption Monitor

LiteRT

System Power Consumption Monitor

LiteRT

CPU Power Consumption Monitor

LiteRT

System Power Consumption Monitor

LiteRT

CPU Power Consumption Monitor

LiteRT

System Power Consumption Monitor

LiteRT

CPU Power Consumption Monitor

LiteRT

Model: NASNet Mobile

LiteRT

System Power Consumption Monitor

LiteRT

CPU Power Consumption Monitor

TensorFlow

System Power Consumption Monitor

TensorFlow

CPU Power Consumption Monitor

TensorFlow

System Power Consumption Monitor

TensorFlow

CPU Power Consumption Monitor

Whisper.cpp

System Power Consumption Monitor

Whisper.cpp

CPU Power Consumption Monitor

Whisper.cpp

System Power Consumption Monitor

Whisper.cpp

CPU Power Consumption Monitor

Whisperfile

System Power Consumption Monitor

Whisperfile

CPU Power Consumption Monitor

Whisperfile

System Power Consumption Monitor

Whisperfile

CPU Power Consumption Monitor

Whisperfile

System Power Consumption Monitor

Whisperfile

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

Backend: CPU BLAS - Model: granite-3.0-3b-a800m-instruct-Q8_0 - Test: Prompt Processing 512

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

Llama.cpp

System Power Consumption Monitor

Llama.cpp

CPU Power Consumption Monitor

OpenVINO GenAI

System Power Consumption Monitor

OpenVINO GenAI

CPU Power Consumption Monitor

OpenVINO GenAI

Model: Gemma-7b-int4-ov - Device: CPU - Time Per Output Token

OpenVINO GenAI

Model: Gemma-7b-int4-ov - Device: CPU - Time To First Token

OpenVINO GenAI

System Power Consumption Monitor

OpenVINO GenAI

CPU Power Consumption Monitor

OpenVINO GenAI

Model: Falcon-7b-instruct-int4-ov - Device: CPU - Time Per Output Token

OpenVINO GenAI

Model: Falcon-7b-instruct-int4-ov - Device: CPU - Time To First Token

OpenVINO GenAI

System Power Consumption Monitor

OpenVINO GenAI

CPU Power Consumption Monitor

OpenVINO GenAI

Model: Phi-3-mini-128k-instruct-int4-ov - Device: CPU - Time Per Output Token

OpenVINO GenAI

Model: Phi-3-mini-128k-instruct-int4-ov - Device: CPU - Time To First Token

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

OpenVINO

System Power Consumption Monitor

OpenVINO

CPU Power Consumption Monitor

Phoronix Test Suite v10.8.5