xeon auggy

Tests for a future article. 2 x Intel Xeon Platinum 8380 testing with a Intel M50CYP2SB2U (SE5C6200.86B.0022.D08.2103221623 BIOS) and ASPEED on Ubuntu 22.10 via the Phoronix Test Suite.

HTML result view exported from: https://openbenchmarking.org/result/2308065-NE-XEONAUGGY78&sor&grs.

libxsmm

M N K: 128

Stress-NG

Test: Cloning

Stress-NG

Test: Pipe

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 100 - Sensor Count: 500

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 100 - Sensor Count: 500

NCNN

Target: CPU - Model: resnet18

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 1 - Sensor Count: 200

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: double - X Y Z: 128

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 1 - Sensor Count: 200

NCNN

Target: CPU - Model: FastestDet

NCNN

Target: CPU - Model: alexnet

Liquid-DSP

Threads: 128 - Buffer Length: 256 - Filter Length: 57

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: float - X Y Z: 256

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: float - X Y Z: 256

NCNN

Target: CPU - Model: resnet50

NCNN

Target: CPU - Model: regnety_400m

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 1 - Sensor Count: 200

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 1 - Sensor Count: 200

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: double - X Y Z: 128

NCNN

Target: CPU - Model: blazeface

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: float - X Y Z: 256

NCNN

Target: CPU - Model: mnasnet

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: double - X Y Z: 128

NCNN

Target: CPU - Model: squeezenet_ssd

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 1 - Sensor Count: 500

NCNN

Target: CPU - Model: vision_transformer

NCNN

Target: CPU - Model: googlenet

Stress-NG

Test: Pthread

Apache IoTDB

Device Count: 500 - Batch Size Per Write: 1 - Sensor Count: 500

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: float - X Y Z: 128

Z3 Theorem Prover

SMT File: 1.smt2

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 1 - Sensor Count: 200

Embree

Binary: Pathtracer - Model: Crown

OSPRay

Benchmark: particle_volume/scivis/real_time

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: double - X Y Z: 512

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 1 - Sensor Count: 200

OSPRay

Benchmark: gravity_spheres_volume/dim_512/scivis/real_time

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 100 - Sensor Count: 200

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: double - X Y Z: 512

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: float - X Y Z: 512

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 100 - Sensor Count: 200

Liquid-DSP

Threads: 16 - Buffer Length: 256 - Filter Length: 512

VVenC

Video Input: Bosphorus 4K - Video Preset: Faster

Remhos

Test: Sample Remap Example

NCNN

Target: CPU - Model: efficientnet-b0

Liquid-DSP

Threads: 16 - Buffer Length: 256 - Filter Length: 57

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: double - X Y Z: 256

Liquid-DSP

Threads: 160 - Buffer Length: 256 - Filter Length: 57

OSPRay

Benchmark: gravity_spheres_volume/dim_512/ao/real_time

libxsmm

M N K: 256

NCNN

Target: CPU - Model: yolov4-tiny

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: float - X Y Z: 512

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 32

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 512

Stress-NG

Test: Vector Floating Point

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 57

NCNN

Target: CPU - Model: mobilenet

Intel Open Image Denoise

Run: RT.hdr_alb_nrm.3840x2160 - Device: CPU-Only

libxsmm

M N K: 32

Liquid-DSP

Threads: 16 - Buffer Length: 256 - Filter Length: 32

Z3 Theorem Prover

SMT File: 2.smt2

VVenC

Video Input: Bosphorus 4K - Video Preset: Fast

NCNN

Target: CPU - Model: shufflenet-v2

NCNN

Target: CPU-v3-v3 - Model: mobilenet-v3

Intel Open Image Denoise

Run: RTLightmap.hdr.4096x4096 - Device: CPU-Only

Intel Open Image Denoise

Run: RT.ldr_alb_nrm.3840x2160 - Device: CPU-Only

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 512

Blender

Blend File: Fishy Cat - Compute: CPU-Only

QuantLib

OSPRay

Benchmark: gravity_spheres_volume/dim_512/pathtracer/real_time

Liquid-DSP

Threads: 128 - Buffer Length: 256 - Filter Length: 32

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: float - X Y Z: 512

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: double - X Y Z: 256

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 1 - Sensor Count: 500

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: float - X Y Z: 128

srsRAN Project

Test: PUSCH Processor Benchmark, Throughput Total

Liquid-DSP

Threads: 128 - Buffer Length: 256 - Filter Length: 512

GPAW

Input: Carbon Nanotube

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: FFTW - Precision: float - X Y Z: 128

Embree

Binary: Pathtracer - Model: Asian Dragon Obj

NCNN

Target: CPU-v2-v2 - Model: mobilenet-v2

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: double - X Y Z: 512

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 57

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: double - X Y Z: 256

VVenC

Video Input: Bosphorus 1080p - Video Preset: Faster

libxsmm

M N K: 64

NCNN

Target: CPU - Model: vgg16

Blender

Blend File: BMW27 - Compute: CPU-Only

Liquid-DSP

Threads: 160 - Buffer Length: 256 - Filter Length: 32

Blender

Blend File: Classroom - Compute: CPU-Only

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 1 - Sensor Count: 500

Liquid-DSP

Threads: 1 - Buffer Length: 256 - Filter Length: 512

Apache IoTDB

Device Count: 100 - Batch Size Per Write: 1 - Sensor Count: 500

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: float - X Y Z: 256

HeFFTe - Highly Efficient FFT for Exascale

Test: c2c - Backend: Stock - Precision: double - X Y Z: 512

Liquid-DSP

Threads: 1 - Buffer Length: 256 - Filter Length: 32

Apache IoTDB

Device Count: 200 - Batch Size Per Write: 1 - Sensor Count: 500

Blender

Blend File: Barbershop - Compute: CPU-Only

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: double - X Y Z: 256

Liquid-DSP

Threads: 160 - Buffer Length: 256 - Filter Length: 512

Timed GCC Compilation

Time To Compile

Embree

Binary: Pathtracer ISPC - Model: Asian Dragon Obj

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: Stock - Precision: double - X Y Z: 128

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: float - X Y Z: 512

Embree

Binary: Pathtracer ISPC - Model: Asian Dragon

Embree

Binary: Pathtracer - Model: Asian Dragon

Stress-NG

Test: Fused Multiply-Add

dav1d

Video Input: Summer Nature 1080p

HeFFTe - Highly Efficient FFT for Exascale

Test: r2c - Backend: FFTW - Precision: float - X Y Z: 128

VVenC

Video Input: Bosphorus 1080p - Video Preset: Fast

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 32

OSPRay

Benchmark: particle_volume/pathtracer/real_time

OSPRay

Benchmark: particle_volume/ao/real_time

dav1d

Video Input: Chimera 1080p

srsRAN Project

Test: PUSCH Processor Benchmark, Throughput Thread

srsRAN Project

Test: Downlink Processor Benchmark

Stress-NG

Test: Vector Shuffle

dav1d

Video Input: Summer Nature 4K

Stress-NG

Test: Wide Vector Math

Opus Codec Encoding

WAV To Opus Encode

Stress-NG

Test: AVL Tree

Liquid-DSP

Threads: 1 - Buffer Length: 256 - Filter Length: 57

dav1d

Video Input: Chimera 1080p 10-bit

Stress-NG

Test: Matrix 3D Math

Stress-NG

Test: Floating Point

Stress-NG

Test: Zlib

Embree

Binary: Pathtracer ISPC - Model: Crown

Apache CouchDB

Bulk Size: 500 - Inserts: 1000 - Rounds: 30

Apache CouchDB

Bulk Size: 300 - Inserts: 1000 - Rounds: 30

Apache CouchDB

Bulk Size: 100 - Inserts: 1000 - Rounds: 30

Phoronix Test Suite v10.8.5