AMD Threadripper 7995WX NPS / SNC2 SNC4 Benchmarks

AMD Ryzen Threadripper PRO 7995WX 96-Cores testing of NPS/SNC settings with default (disabled), SNC2, and SNC4 modes. Benchmarks by Michael Larabel for a future article.

HTML result view exported from: https://openbenchmarking.org/result/2311288-NE-TR7995WXN68&rdt&grr.

GPAW

Input: Carbon Nanotube

PETSc

Test: Streams

OpenVKL

Benchmark: vklBenchmarkCPU ISPC

GROMACS

Implementation: MPI CPU - Input: water_GMX50_bare

PyTorch

Device: CPU - Batch Size: 16 - Model: Efficientnet_v2_l

PostgreSQL

Scaling Factor: 100 - Clients: 1000 - Mode: Read Write - Average Latency

PostgreSQL

Scaling Factor: 100 - Clients: 1000 - Mode: Read Write

ClickHouse

100M Rows Hits Dataset, Third Run

ClickHouse

100M Rows Hits Dataset, Second Run

ClickHouse

100M Rows Hits Dataset, First Run / Cold Cache

PyTorch

Device: CPU - Batch Size: 64 - Model: Efficientnet_v2_l

PyTorch

Device: CPU - Batch Size: 32 - Model: Efficientnet_v2_l

libxsmm

M N K: 128

TensorFlow

Device: CPU - Batch Size: 512 - Model: ResNet-50

PostgreSQL

Scaling Factor: 1000 - Clients: 1000 - Mode: Read Write - Average Latency

PostgreSQL

Scaling Factor: 1000 - Clients: 1000 - Mode: Read Write

CloverLeaf

Input: clover_bm16

Quantum ESPRESSO

Input: AUSURF112

PostgreSQL

Scaling Factor: 1000 - Clients: 1000 - Mode: Read Only - Average Latency

PostgreSQL

Scaling Factor: 1000 - Clients: 1000 - Mode: Read Only

TensorFlow

Device: CPU - Batch Size: 256 - Model: ResNet-50

Stockfish

Total Time

LuxCoreRender

Scene: Orange Juice - Acceleration: CPU

John The Ripper

Test: MD5

Rodinia

Test: OpenMP HotSpot3D

ASKAP

Test: tConvolve MT - Degridding

ASKAP

Test: tConvolve MT - Gridding

Graph500

Scale: 26

Graph500

Scale: 26

Graph500

Scale: 26

Graph500

Scale: 26

Timed Linux Kernel Compilation

Build: allmodconfig

John The Ripper

Test: HMAC-SHA512

PostgreSQL

Scaling Factor: 100 - Clients: 1000 - Mode: Read Only - Average Latency

PostgreSQL

Scaling Factor: 100 - Clients: 1000 - Mode: Read Only

easyWave

Input: e2Asean Grid + BengkuluSept2007 Source - Time: 2400

OpenRadioss

Model: Chrysler Neon 1M

OpenSSL

Algorithm: AES-128-GCM

OpenSSL

Algorithm: SHA256

OpenSSL

Algorithm: SHA512

OpenSSL

Algorithm: ChaCha20-Poly1305

OpenSSL

Algorithm: AES-256-GCM

OpenSSL

Algorithm: ChaCha20

libxsmm

M N K: 256

Timed Gem5 Compilation

Time To Compile

Timed LLVM Compilation

Build System: Unix Makefiles

PyTorch

Device: CPU - Batch Size: 16 - Model: ResNet-152

NAS Parallel Benchmarks

Test / Class: SP.C

OpenFOAM

Input: drivaerFastback, Medium Mesh Size - Execution Time

OpenFOAM

Input: drivaerFastback, Medium Mesh Size - Mesh Time

Blender

Blend File: Barbershop - Compute: CPU-Only

PyTorch

Device: CPU - Batch Size: 64 - Model: ResNet-152

PyTorch

Device: CPU - Batch Size: 32 - Model: ResNet-152

Timed Node.js Compilation

Time To Compile

easyWave

Input: e2Asean Grid + BengkuluSept2007 Source - Time: 1200

Timed LLVM Compilation

Build System: Ninja

PyTorch

Device: CPU - Batch Size: 1 - Model: Efficientnet_v2_l

QMCPACK

Input: Li2_STO_ae

ASKAP

Test: tConvolve MPI - Gridding

ASKAP

Test: tConvolve MPI - Degridding

asmFish

1024 Hash Memory, 26 Depth

Numpy Benchmark

John The Ripper

Test: Blowfish

TensorFlow

Device: CPU - Batch Size: 64 - Model: ResNet-50

SPECFEM3D

Model: Tomographic Model

VVenC

Video Input: Bosphorus 4K - Video Preset: Fast

John The Ripper

Test: bcrypt

OSPRay Studio

Camera: 3 - Resolution: 4K - Samples Per Pixel: 16 - Renderer: Path Tracer - Acceleration: CPU

Memcached

Set To Get Ratio: 1:100

Memcached

Set To Get Ratio: 1:10

Memcached

Set To Get Ratio: 1:5

OSPRay Studio

Camera: 3 - Resolution: 4K - Samples Per Pixel: 1 - Renderer: Path Tracer - Acceleration: CPU

OSPRay Studio

Camera: 1 - Resolution: 4K - Samples Per Pixel: 1 - Renderer: Path Tracer - Acceleration: CPU

OSPRay Studio

Camera: 2 - Resolution: 4K - Samples Per Pixel: 1 - Renderer: Path Tracer - Acceleration: CPU

OSPRay Studio

Camera: 2 - Resolution: 4K - Samples Per Pixel: 16 - Renderer: Path Tracer - Acceleration: CPU

OSPRay Studio

Camera: 1 - Resolution: 4K - Samples Per Pixel: 16 - Renderer: Path Tracer - Acceleration: CPU

OpenVINO

Model: Face Detection FP16 - Device: CPU

OpenVINO

Model: Face Detection FP16 - Device: CPU

OpenVINO

Model: Face Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Face Detection FP16-INT8 - Device: CPU

LuxCoreRender

Scene: Danish Mood - Acceleration: CPU

PyTorch

Device: CPU - Batch Size: 1 - Model: ResNet-152

Timed CPython Compilation

Build Configuration: Released Build, PGO + LTO Optimized

LuxCoreRender

Scene: LuxCore Benchmark - Acceleration: CPU

OpenVINO

Model: Person Detection FP32 - Device: CPU

OpenVINO

Model: Person Detection FP32 - Device: CPU

OpenVINO

Model: Person Detection FP16 - Device: CPU

OpenVINO

Model: Person Detection FP16 - Device: CPU

OpenVINO

Model: Machine Translation EN To DE FP16 - Device: CPU

OpenVINO

Model: Machine Translation EN To DE FP16 - Device: CPU

QuantLib

Configuration: Multi-Threaded

OpenVINO

Model: Person Vehicle Bike Detection FP16 - Device: CPU

OpenVINO

Model: Person Vehicle Bike Detection FP16 - Device: CPU

OpenVINO

Model: Face Detection Retail FP16-INT8 - Device: CPU

OpenVINO

Model: Face Detection Retail FP16-INT8 - Device: CPU

OpenVINO

Model: Road Segmentation ADAS FP16-INT8 - Device: CPU

OpenVINO

Model: Road Segmentation ADAS FP16-INT8 - Device: CPU

OpenVINO

Model: Road Segmentation ADAS FP16 - Device: CPU

OpenVINO

Model: Road Segmentation ADAS FP16 - Device: CPU

LuxCoreRender

Scene: DLSC - Acceleration: CPU

OpenVINO

Model: Handwritten English Recognition FP16-INT8 - Device: CPU

OpenVINO

Model: Handwritten English Recognition FP16-INT8 - Device: CPU

OpenVINO

Model: Age Gender Recognition Retail 0013 FP16-INT8 - Device: CPU

OpenVINO

Model: Age Gender Recognition Retail 0013 FP16-INT8 - Device: CPU

OpenVINO

Model: Handwritten English Recognition FP16 - Device: CPU

OpenVINO

Model: Handwritten English Recognition FP16 - Device: CPU

OpenVINO

Model: Age Gender Recognition Retail 0013 FP16 - Device: CPU

OpenVINO

Model: Age Gender Recognition Retail 0013 FP16 - Device: CPU

OpenVINO

Model: Weld Porosity Detection FP16 - Device: CPU

OpenVINO

Model: Weld Porosity Detection FP16 - Device: CPU

OpenVINO

Model: Vehicle Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Vehicle Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Weld Porosity Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Weld Porosity Detection FP16-INT8 - Device: CPU

OpenVINO

Model: Vehicle Detection FP16 - Device: CPU

OpenVINO

Model: Vehicle Detection FP16 - Device: CPU

OpenVINO

Model: Face Detection Retail FP16 - Device: CPU

OpenVINO

Model: Face Detection Retail FP16 - Device: CPU

OpenSSL

Algorithm: RSA4096

OpenSSL

Algorithm: RSA4096

TensorFlow

Device: CPU - Batch Size: 32 - Model: ResNet-50

PyTorch

Device: CPU - Batch Size: 32 - Model: ResNet-50

PyTorch

Device: CPU - Batch Size: 64 - Model: ResNet-50

PyTorch

Device: CPU - Batch Size: 16 - Model: ResNet-50

OSPRay Studio

Camera: 3 - Resolution: 4K - Samples Per Pixel: 32 - Renderer: Path Tracer - Acceleration: CPU

Blender

Blend File: Pabellon Barcelona - Compute: CPU-Only

OSPRay Studio

Camera: 2 - Resolution: 4K - Samples Per Pixel: 32 - Renderer: Path Tracer - Acceleration: CPU

OSPRay Studio

Camera: 1 - Resolution: 4K - Samples Per Pixel: 32 - Renderer: Path Tracer - Acceleration: CPU

VVenC

Video Input: Bosphorus 4K - Video Preset: Faster

CloverLeaf

Input: clover_bm64_short

CloverLeaf

Input: clover_bm

TensorFlow

Device: CPU - Batch Size: 16 - Model: ResNet-50

Radiance Benchmark

Test: SMP Parallel

Blender

Blend File: Classroom - Compute: CPU-Only

Timed Linux Kernel Compilation

Build: defconfig

LULESH

7-Zip Compression

Test: Decompression Rating

7-Zip Compression

Test: Compression Rating

Algebraic Multi-Grid Benchmark

SPECFEM3D

Model: Homogeneous Halfspace

Liquid-DSP

Threads: 192 - Buffer Length: 256 - Filter Length: 512

Rodinia

Test: OpenMP Leukocyte

Liquid-DSP

Threads: 128 - Buffer Length: 256 - Filter Length: 512

John The Ripper

Test: WPA PSK

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 512

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 512

Liquid-DSP

Threads: 192 - Buffer Length: 256 - Filter Length: 57

Liquid-DSP

Threads: 192 - Buffer Length: 256 - Filter Length: 32

Liquid-DSP

Threads: 128 - Buffer Length: 256 - Filter Length: 57

Liquid-DSP

Threads: 128 - Buffer Length: 256 - Filter Length: 32

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 57

Liquid-DSP

Threads: 64 - Buffer Length: 256 - Filter Length: 32

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 32

Liquid-DSP

Threads: 32 - Buffer Length: 256 - Filter Length: 57

VVenC

Video Input: Bosphorus 1080p - Video Preset: Fast

Rodinia

Test: OpenMP LavaMD

PyTorch

Device: CPU - Batch Size: 1 - Model: ResNet-50

SPECFEM3D

Model: Water-layered Halfspace

SPECFEM3D

Model: Layered Halfspace

LuxCoreRender

Scene: Rainbow Colors and Prism - Acceleration: CPU

Blender

Blend File: Fishy Cat - Compute: CPU-Only

uvg266

Video Input: Bosphorus 4K - Video Preset: Slow

NAMD

ATPase Simulation - 327,506 Atoms

uvg266

Video Input: Bosphorus 4K - Video Preset: Medium

VVenC

Video Input: Bosphorus 1080p - Video Preset: Faster

ASKAP

Test: tConvolve OpenMP - Degridding

ASKAP

Test: tConvolve OpenMP - Gridding

Blender

Blend File: BMW27 - Compute: CPU-Only

NAS Parallel Benchmarks

Test / Class: BT.C

Embree

Binary: Pathtracer ISPC - Model: Asian Dragon Obj

ASKAP

Test: Hogbom Clean OpenMP

Xcompact3d Incompact3d

Input: input.i3d 193 Cells Per Direction

libxsmm

M N K: 64

SPECFEM3D

Model: Mount St. Helens

NAS Parallel Benchmarks

Test / Class: IS.D

libxsmm

M N K: 32

uvg266

Video Input: Bosphorus 4K - Video Preset: Very Fast

uvg266

Video Input: Bosphorus 4K - Video Preset: Super Fast

uvg266

Video Input: Bosphorus 4K - Video Preset: Ultra Fast

NAS Parallel Benchmarks

Test / Class: LU.C

NAS Parallel Benchmarks

Test / Class: EP.C

Embree

Binary: Pathtracer ISPC - Model: Crown

Embree

Binary: Pathtracer ISPC - Model: Asian Dragon

uvg266

Video Input: Bosphorus 1080p - Video Preset: Slow

uvg266

Video Input: Bosphorus 1080p - Video Preset: Medium

NAS Parallel Benchmarks

Test / Class: FT.C

Rodinia

Test: OpenMP CFD Solver

ACES DGEMM

Sustained Floating-Point Rate

Rodinia

Test: OpenMP Streamcluster

Xcompact3d Incompact3d

Input: input.i3d 129 Cells Per Direction

NAS Parallel Benchmarks

Test / Class: CG.C

NAS Parallel Benchmarks

Test / Class: SP.B

NAS Parallel Benchmarks

Test / Class: MG.C

uvg266

Video Input: Bosphorus 1080p - Video Preset: Very Fast

uvg266

Video Input: Bosphorus 1080p - Video Preset: Ultra Fast

uvg266

Video Input: Bosphorus 1080p - Video Preset: Super Fast

Phoronix Test Suite v10.8.5