nvidia rtx 5090 compute benchmarks

Tests for a future article. Intel Core Ultra 9 285K testing with a ASUS ROG MAXIMUS Z890 HERO (1203 BIOS) and ASUS NVIDIA GeForce RTX 5090 32GB on Ubuntu 24.10 via the Phoronix Test Suite.

HTML result view exported from: https://openbenchmarking.org/result/2501242-PTS-NVIDIART00&sro&grs.

NCNN

Target: Vulkan GPU - Model: mnasnet

NCNN

Target: Vulkan GPU - Model: regnety_400m

NCNN

Target: Vulkan GPU - Model: googlenet

NCNN

Target: Vulkan GPU - Model: efficientnet-b0

NCNN

Target: Vulkan GPU-v2-v2 - Model: mobilenet-v2

NCNN

Target: Vulkan GPU - Model: FastestDet

NCNN

Target: Vulkan GPU - Model: shufflenet-v2

NCNN

Target: Vulkan GPU - Model: squeezenet_ssd

NCNN

Target: Vulkan GPU - Model: resnet18

NCNN

Target: Vulkan GPU - Model: blazeface

NCNN

Target: Vulkan GPU-v3-v3 - Model: mobilenet-v3

NCNN

Target: Vulkan GPUv2-yolov3v2-yolov3 - Model: mobilenetv2-yolov3

NCNN

Target: Vulkan GPU - Model: mobilenet

NCNN

Target: Vulkan GPU - Model: yolov4-tiny

NCNN

Target: Vulkan GPU - Model: resnet50

RealSR-NCNN

Scale: 4x - TAA: No

NCNN

Target: Vulkan GPU - Model: alexnet

NCNN

Target: Vulkan GPU - Model: vgg16

NAMD CUDA

ATPase Simulation - 327,506 Atoms

Blender

Blend File: BMW27 - Compute: NVIDIA OptiX

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Bus Speed Readback

VkFFT

Test: FFT + iFFT C2C 1D batched in half precision

VkFFT

Test: FFT + iFFT C2C 1D batched in single precision

VkFFT

Test: FFT + iFFT C2C 1D batched in double precision

Blender

Blend File: BMW27 - Compute: NVIDIA CUDA

Waifu2x-NCNN Vulkan

Scale: 2x - Denoise: 3 - TAA: Yes

Blender

Blend File: Barbershop - Compute: NVIDIA OptiX

Blender

Blend File: Pabellon Barcelona - Compute: NVIDIA OptiX

VkFFT

Test: FFT + iFFT C2C 1D batched in single precision, no reshuffling

clpeak

OpenCL Test: Transfer Bandwidth enqueueReadBuffer

Chaos Group V-RAY

Mode: NVIDIA CUDA GPU

Hashcat

Benchmark: MD5

Blender

Blend File: Pabellon Barcelona - Compute: NVIDIA CUDA

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: FFT SP

Blender

Blend File: Barbershop - Compute: NVIDIA CUDA

clpeak

OpenCL Test: Transfer Bandwidth enqueueWriteBuffer

Blender

Blend File: Classroom - Compute: NVIDIA OptiX

ProjectPhysX OpenCL-Benchmark

Operation: Memory Bandwidth Coalesced Read

ProjectPhysX OpenCL-Benchmark

Operation: Memory Bandwidth Coalesced Write

IndigoBench

Acceleration: OpenCL GPU - Scene: Bedroom

Hashcat

Benchmark: 7-Zip

Hashcat

Benchmark: SHA1

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Triad

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: S3D

VkFFT

Test: FFT + iFFT C2C Bluestein in single precision

Hashcat

Benchmark: TrueCrypt RIPEMD160 + XTS

Blender

Blend File: Junkshop - Compute: NVIDIA CUDA

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: GEMM SGEMM_N

Blender

Blend File: Fishy Cat - Compute: NVIDIA OptiX

IndigoBench

Acceleration: OpenCL GPU - Scene: Supercar

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: MD5 Hash

clpeak

OpenCL Test: Kernel Latency

ProjectPhysX OpenCL-Benchmark

Operation: INT64 Compute

Blender

Blend File: Junkshop - Compute: NVIDIA OptiX

ProjectPhysX OpenCL-Benchmark

Operation: INT8 Compute

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Texture Read Bandwidth

NCNN

Target: Vulkan GPU - Model: vision_transformer

ProjectPhysX OpenCL-Benchmark

Operation: INT16 Compute

RealSR-NCNN

Scale: 4x - TAA: Yes

clpeak

OpenCL Test: Global Memory Bandwidth

FluidX3D

Test: FP32-FP16C

clpeak

OpenCL Test: Integer 24-bit Compute

clpeak

OpenCL Test: Integer Compute

VkFFT

Test: FFT + iFFT C2C Bluestein benchmark in double precision

VkFFT

Test: FFT + iFFT R2C / C2R

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Max SP Flops

VkFFT

Test: FFT + iFFT C2C multidimensional in single precision

Hashcat

Benchmark: SHA-512

ProjectPhysX OpenCL-Benchmark

Operation: FP64 Compute

VkResample

Upscale: 2x - Precision: Double

vkpeak

fp32-vec4

vkpeak

int32-vec4

vkpeak

int16-scalar

vkpeak

fp32-scalar

FluidX3D

Test: FP32-FP32

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Reduction

ProjectPhysX OpenCL-Benchmark

Operation: FP32 Compute

ProjectPhysX OpenCL-Benchmark

Operation: FP16 Compute

clpeak

OpenCL Test: Double-Precision Compute

vkpeak

fp16-vec4

vkpeak

fp16-scalar

ProjectPhysX OpenCL-Benchmark

Operation: INT32 Compute

FluidX3D

Test: FP32-FP16S

vkpeak

fp64-vec4

clpeak

OpenCL Test: Single-Precision Compute

VkResample

Upscale: 2x - Precision: Single

vkpeak

int16-vec4

vkpeak

fp64-scalar

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Bus Speed Download

vkpeak

int32-scalar

Chaos Group V-RAY

Mode: NVIDIA RTX GPU

Blender

Blend File: Fishy Cat - Compute: NVIDIA CUDA

Blender

Blend File: Classroom - Compute: NVIDIA CUDA

Phoronix Test Suite v10.8.5