new xeon

Tests for a future article. Intel Xeon Gold 6421N testing with a Quanta Cloud S6Q-MB-MPS (3A10.uh BIOS) and ASPEED on Ubuntu 22.04 via the Phoronix Test Suite.

HTML result view exported from: https://openbenchmarking.org/result/2307315-NE-NEWXEON9432&sor&grs.

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 100 - Sensor Count: 200

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 100 - Sensor Count: 200

Stress-NG

Test: CPU Cache

libxsmm

M N K: 256

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 100 - Sensor Count: 200

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 100 - Sensor Count: 500

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 1 - Sensor Count: 500

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: double - X Y Z: 128

Neural Magic DeepSparse

Model: BERT-Large, NLP Question Answering - Scenario: Asynchronous Multi-Stream

Redis 7.0.12 + memtier_benchmark

Protocol: Redis - Clients: 100 - Set To Get Ratio: 1:10

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 100 - Sensor Count: 200

Neural Magic DeepSparse

Model: BERT-Large, NLP Question Answering - Scenario: Asynchronous Multi-Stream

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 100 - Sensor Count: 500

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 1 - Sensor Count: 500

Stress-NG

Test: Cloning

Neural Magic DeepSparse

Model: NLP Text Classification, BERT base uncased SST2 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Text Classification, BERT base uncased SST2 - Scenario: Asynchronous Multi-Stream

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 1 - Sensor Count: 200

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: float - X Y Z: 256

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 1 - Sensor Count: 200

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: double - X Y Z: 128

Stress-NG

Test: Futex

srsRAN Project

Test: PUSCH Processor Benchmark, Throughput Total

Stress-NG

Test: Pipe

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: float - X Y Z: 256

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 1 - Sensor Count: 200

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 1 - Sensor Count: 200

Stress-NG

Test: SENDFILE

Redis 7.0.12 + memtier_benchmark

Protocol: Redis - Clients: 100 - Set To Get Ratio: 1:5

Stress-NG

Test: Matrix Math

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 100 - Sensor Count: 500

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 100 - Sensor Count: 500

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 1 - Sensor Count: 500

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 100 - Sensor Count: 500

Liquid-DSP

Threads: 16 - Buffer Length: 256 - Filter Length: 512

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 1 - Sensor Count: 200

Neural Magic DeepSparse

Model: NLP Token Classification, BERT base uncased conll2003 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Token Classification, BERT base uncased conll2003 - Scenario: Asynchronous Multi-Stream

srsRAN Project

Test: PUSCH Processor Benchmark, Throughput Thread

Stress-NG

Test: IO_uring

Liquid-DSP

Threads: 16 - Buffer Length: 256 - Filter Length: 57

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: double - X Y Z: 128

Neural Magic DeepSparse

Model: NLP Text Classification, DistilBERT mnli - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Text Classification, DistilBERT mnli - Scenario: Asynchronous Multi-Stream

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 100 - Sensor Count: 200

Stress-NG

Test: Socket Activity

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 1 - Sensor Count: 500

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 512

VVenC

Video Input: Bosphorus 4K - Video Preset: Fast

Timed LLVM Compilation

Build System: Unix Makefiles

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: float - X Y Z: 128

Neural Magic DeepSparse

Model: CV Detection, YOLOv5s COCO, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: CV Detection, YOLOv5s COCO, Sparse INT8 - Scenario: Asynchronous Multi-Stream

libxsmm

M N K: 128

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: double - X Y Z: 256

libxsmm

M N K: 32

Redis 7.0.12 + memtier_benchmark

Protocol: Redis - Clients: 50 - Set To Get Ratio: 1:10

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: float - X Y Z: 256

VVenC

Video Input: Bosphorus 1080p - Video Preset: Fast

Stress-NG

Test: Atomic

Stress-NG

Test: Semaphores

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: double - X Y Z: 256

libxsmm

M N K: 64

srsRAN Project

Test: Downlink Processor Benchmark

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 1 - Sensor Count: 500

Stress-NG

Test: MMAP

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: double - X Y Z: 128

Palabos

Grid Size: 400

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 1 - Sensor Count: 500

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: float - X Y Z: 128

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: float - X Y Z: 128

Laghos

Test: Triple Point Problem

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 100 - Sensor Count: 500

Neural Magic DeepSparse

Model: CV Segmentation, 90% Pruned YOLACT Pruned - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: CV Segmentation, 90% Pruned YOLACT Pruned - Scenario: Asynchronous Multi-Stream

Stress-NG

Test: Fused Multiply-Add

High Performance Conjugate Gradient

X Y Z: 160 160 160 - RT: 60

Stress-NG

Test: Function Call

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 100 - Sensor Count: 200

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: double - X Y Z: 512

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 57

Stress-NG

Test: NUMA

Stress-NG

Test: Mutex

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: float - X Y Z: 128

Neural Magic DeepSparse

Model: NLP Question Answering, BERT base uncased SQuaD 12layer Pruned90 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Question Answering, BERT base uncased SQuaD 12layer Pruned90 - Scenario: Asynchronous Multi-Stream

Stress-NG

Test: Wide Vector Math

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 1 - Sensor Count: 200

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 57

Neural Magic DeepSparse

Model: NLP Sentiment Analysis, 80% Pruned Quantized BERT Base Uncased - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: NLP Sentiment Analysis, 80% Pruned Quantized BERT Base Uncased - Scenario: Asynchronous Multi-Stream

VVenC

Video Input: Bosphorus 4K - Video Preset: Faster

Redis 7.0.12 + memtier_benchmark

Protocol: Redis - Clients: 50 - Set To Get Ratio: 1:5

Timed GDB GNU Debugger Compilation

Time To Compile

Stress-NG

Test: Glibc C String Functions

High Performance Conjugate Gradient

X Y Z: 104 104 104 - RT: 60

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: float - X Y Z: 256

OpenFOAM

Input: drivaerFastback, Small Mesh Size - Execution Time

Neural Magic DeepSparse

Model: ResNet-50, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: ResNet-50, Sparse INT8 - Scenario: Asynchronous Multi-Stream

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: double - X Y Z: 512

Palabos

Grid Size: 500

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: double - X Y Z: 256

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: float - X Y Z: 512

OpenFOAM

Input: drivaerFastback, Medium Mesh Size - Mesh Time

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: float - X Y Z: 512

Neural Magic DeepSparse

Model: ResNet-50, Baseline - Scenario: Asynchronous Multi-Stream

Laghos

Test: Sedov Blast Wave, ube_922_hex.mesh

Neural Magic DeepSparse

Model: ResNet-50, Baseline - Scenario: Asynchronous Multi-Stream

Blender

Blend File: BMW27 - Compute: CPU-Only

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: float - X Y Z: 512

Stress-NG

Test: AVL Tree

Palabos

Grid Size: 100

Stress-NG

Test: Floating Point

Liquid-DSP

Threads: 16 - Buffer Length: 256 - Filter Length: 32

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: double - X Y Z: 256

Stress-NG

Test: Malloc

Stress-NG

Test: Hash

Neural Magic DeepSparse

Model: CV Detection, YOLOv5s COCO - Scenario: Asynchronous Multi-Stream

High Performance Conjugate Gradient

X Y Z: 144 144 144 - RT: 60

Neural Magic DeepSparse

Model: NLP Text Classification, BERT base uncased SST2, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: BERT-Large, NLP Question Answering, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Timed LLVM Compilation

Build System: Ninja

Stress-NG

Test: Pthread

Blender

Blend File: Fishy Cat - Compute: CPU-Only

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: double - X Y Z: 512

OpenFOAM

Input: drivaerFastback, Medium Mesh Size - Execution Time

Neural Magic DeepSparse

Model: NLP Text Classification, BERT base uncased SST2, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: BERT-Large, NLP Question Answering, Sparse INT8 - Scenario: Asynchronous Multi-Stream

Timed PHP Compilation

Time To Compile

Stress-NG

Test: MEMFD

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 32

Stress-NG

Test: Context Switching

Neural Magic DeepSparse

Model: NLP Document Classification, oBERT base uncased on IMDB - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: CV Classification, ResNet-50 ImageNet - Scenario: Asynchronous Multi-Stream

Neural Magic DeepSparse

Model: CV Classification, ResNet-50 ImageNet - Scenario: Asynchronous Multi-Stream

Stress-NG

Test: Poll

VVenC

Video Input: Bosphorus 1080p - Video Preset: Faster

Stress-NG

Test: Memory Copying

OpenFOAM

Input: drivaerFastback, Small Mesh Size - Mesh Time

Stress-NG

Test: Matrix 3D Math

Stress-NG

Test: Forking

Neural Magic DeepSparse

Model: CV Detection, YOLOv5s COCO - Scenario: Asynchronous Multi-Stream

Stress-NG

Test: Glibc Qsort Data Sorting

Stress-NG

Test: Zlib

Stress-NG

Test: System V Message Passing

Blender

Blend File: Barbershop - Compute: CPU-Only

Timed Linux Kernel Compilation

Build: defconfig

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: float - X Y Z: 512

Stress-NG

Test: Vector Math

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 32

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 512

Stress-NG

Test: Vector Floating Point

Blender

Blend File: Classroom - Compute: CPU-Only

Stress-NG

Test: CPU Stress

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: double - X Y Z: 512

Stress-NG

Test: Crypto

Neural Magic DeepSparse

Model: NLP Document Classification, oBERT base uncased on IMDB - Scenario: Asynchronous Multi-Stream