xeon jan

Intel Xeon Silver 4216 testing with a TYAN S7100AG2NR (V4.02 BIOS) and ASPEED on Debian 12 via the Phoronix Test Suite.

Quicksilver

Quicksilver

PyTorch

PyTorch

LeelaChessZero

LeelaChessZero

Llama.cpp

TensorFlow

PyTorch

PyTorch

PyTorch

CacheBench

CacheBench

CacheBench

TensorFlow

Quicksilver

PyTorch

Neural Magic DeepSparse

Neural Magic DeepSparse

PyTorch

PyTorch

Llama.cpp

SVT-AV1

Speedb

Speedb

Speedb

Speedb

Speedb

Speedb

Speedb

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Y-Cruncher

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

PyTorch

Neural Magic DeepSparse

Neural Magic DeepSparse

TensorFlow

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

Neural Magic DeepSparse

TensorFlow

TensorFlow

SVT-AV1

TensorFlow

SVT-AV1

Y-Cruncher

Llama.cpp

SVT-AV1

TensorFlow

SVT-AV1

SVT-AV1

TensorFlow

SVT-AV1

SVT-AV1

Phoronix Test Suite v10.8.5

xeon jan

Quicksilver

Input: CTS2

Quicksilver

Input: CORAL2 P2

PyTorch

Device: CPU - Batch Size: 16 - Model: Efficientnet_v2_l

PyTorch

Device: CPU - Batch Size: 32 - Model: Efficientnet_v2_l

LeelaChessZero

Backend: BLAS

LeelaChessZero

Backend: Eigen

Llama.cpp

Model: llama-2-70b-chat.Q5_0.gguf

TensorFlow

Device: CPU - Batch Size: 16 - Model: VGG-16

PyTorch

Device: CPU - Batch Size: 32 - Model: ResNet-152

PyTorch

Device: CPU - Batch Size: 16 - Model: ResNet-152

PyTorch

Device: CPU - Batch Size: 1 - Model: Efficientnet_v2_l

CacheBench

Test: Read / Modify / Write

CacheBench

Test: Write

CacheBench

Test: Read

TensorFlow

Device: CPU - Batch Size: 16 - Model: ResNet-50

Quicksilver

Input: CORAL2 P1

PyTorch

Device: CPU - Batch Size: 1 - Model: ResNet-152

Neural Magic DeepSparse

Model: BERT-Large, NLP Question Answering - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: BERT-Large, NLP Question Answering - Scenario: Asynchronous Multi-Stream

PyTorch

Device: CPU - Batch Size: 16 - Model: ResNet-50

PyTorch

Device: CPU - Batch Size: 32 - Model: ResNet-50

Llama.cpp

Model: llama-2-13b.Q4_0.gguf

SVT-AV1

Encoder Mode: Preset 4 - Input: Bosphorus 4K

Speedb

Test: Random Fill Sync

Speedb

Test: Random Fill

Speedb

Test: Update Random

Speedb

Test: Read While Writing

Speedb

Test: Read Random Write Random

Speedb

Test: Random Read

Speedb

Test: Sequential Fill

Neural Magic DeepSparse

Model: NLP Text Classification, BERT base uncased SST2, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Text Classification, BERT base uncased SST2, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Document Classification, oBERT base uncased on IMDB - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Document Classification, oBERT base uncased on IMDB - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Token Classification, BERT base uncased conll2003 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Token Classification, BERT base uncased conll2003 - Scenario: Asynchronous Multi-Stream

Y-Cruncher

Pi Digits To Calculate: 1B

Neural Magic DeepSparse

Model: BERT-Large, NLP Question Answering, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: BERT-Large, NLP Question Answering, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse