RTX 4070 SUPER

Intel Core i9-13900K testing with a ASUS TUF GAMING Z790-PRO WIFI (1401 BIOS) and ASUS NVIDIA GeForce RTX 4070 SUPER 12GB on EndeavourOS rolling via the Phoronix Test Suite.

HTML result view exported from: https://openbenchmarking.org/result/2401272-NE-RTX4070SU26&grr.

TensorFlow

Device: GPU - Batch Size: 32 - Model: VGG-16

TensorFlow

Device: GPU - Batch Size: 512 - Model: AlexNet

TensorFlow

Device: GPU - Batch Size: 64 - Model: ResNet-50

TensorFlow

Device: GPU - Batch Size: 256 - Model: AlexNet

TensorFlow

Device: GPU - Batch Size: 16 - Model: VGG-16

TensorFlow

Device: GPU - Batch Size: 32 - Model: ResNet-50

TensorFlow

Device: GPU - Batch Size: 16 - Model: ResNet-50

GpuOwl

Exponent: 77936867

GpuOwl

Exponent: 332220523

TensorFlow

Device: GPU - Batch Size: 64 - Model: GoogLeNet

TensorFlow

Device: GPU - Batch Size: 32 - Model: GoogLeNet

OctaneBench

Total Score

GpuOwl

Exponent: 57885161

TensorFlow

Device: GPU - Batch Size: 16 - Model: GoogLeNet

FAHBench

LuxCoreRender

Scene: LuxCore Benchmark - Acceleration: GPU

LuxCoreRender

Scene: DLSC - Acceleration: GPU

IndigoBench

Acceleration: OpenCL GPU - Scene: Bedroom

VkResample

Upscale: 2x - Precision: Double

IndigoBench

Acceleration: OpenCL GPU - Scene: Supercar

TensorFlow

Device: GPU - Batch Size: 32 - Model: AlexNet

TensorFlow

Device: GPU - Batch Size: 64 - Model: AlexNet

LuxCoreRender

Scene: Orange Juice - Acceleration: GPU

LuxCoreRender

Scene: Danish Mood - Acceleration: GPU

Blender

Blend File: Barbershop - Compute: NVIDIA OptiX

TensorFlow

Device: GPU - Batch Size: 16 - Model: AlexNet

NAMD CUDA

ATPase Simulation - 327,506 Atoms

Blender

Blend File: Fishy Cat - Compute: NVIDIA OptiX

RealSR-NCNN

Scale: 4x - TAA: Yes

RealSR-NCNN

Scale: 4x - TAA: No

TensorFlow

Device: GPU - Batch Size: 1 - Model: VGG-16

Blender

Blend File: BMW27 - Compute: NVIDIA OptiX

ViennaCL

Test: CPU BLAS - dGEMM-TT

ViennaCL

Test: CPU BLAS - dGEMM-TN

ViennaCL

Test: CPU BLAS - dGEMM-NT

ViennaCL

Test: CPU BLAS - dGEMM-NN

ViennaCL

Test: CPU BLAS - dGEMV-T

ViennaCL

Test: CPU BLAS - dGEMV-N

ViennaCL

Test: CPU BLAS - dDOT

ViennaCL

Test: CPU BLAS - dAXPY

ViennaCL

Test: CPU BLAS - dCOPY

ViennaCL

Test: CPU BLAS - sDOT

ViennaCL

Test: CPU BLAS - sAXPY

ViennaCL

Test: CPU BLAS - sCOPY

ViennaCL

Test: OpenCL BLAS - dGEMM-TT

ViennaCL

Test: OpenCL BLAS - dGEMM-TN

ViennaCL

Test: OpenCL BLAS - dGEMM-NT

ViennaCL

Test: OpenCL BLAS - dGEMM-NN

ViennaCL

Test: OpenCL BLAS - dGEMV-T

ViennaCL

Test: OpenCL BLAS - dGEMV-N

ViennaCL

Test: OpenCL BLAS - dDOT

ViennaCL

Test: OpenCL BLAS - dAXPY

ViennaCL

Test: OpenCL BLAS - dCOPY

ViennaCL

Test: OpenCL BLAS - sDOT

ViennaCL

Test: OpenCL BLAS - sAXPY

ViennaCL

Test: OpenCL BLAS - sCOPY

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 64 - Model: Efficientnet_v2_l

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 256 - Model: Efficientnet_v2_l

Blender

Blend File: Pabellon Barcelona - Compute: NVIDIA OptiX

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 64 - Model: ResNet-152

Blender

Blend File: Classroom - Compute: NVIDIA OptiX

ProjectPhysX OpenCL-Benchmark

Operation: Memory Bandwidth Coalesced Write

ProjectPhysX OpenCL-Benchmark

Operation: Memory Bandwidth Coalesced Read

ProjectPhysX OpenCL-Benchmark

Operation: INT8 Compute

ProjectPhysX OpenCL-Benchmark

Operation: INT16 Compute

ProjectPhysX OpenCL-Benchmark

Operation: INT32 Compute

ProjectPhysX OpenCL-Benchmark

Operation: INT64 Compute

ProjectPhysX OpenCL-Benchmark

Operation: FP32 Compute

ProjectPhysX OpenCL-Benchmark

Operation: FP64 Compute

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 512 - Model: ResNet-152

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 256 - Model: ResNet-152

TensorFlow

Device: GPU - Batch Size: 1 - Model: ResNet-50

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 32 - Model: Efficientnet_v2_l

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 512 - Model: Efficientnet_v2_l

VkResample

Upscale: 2x - Precision: Single

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 256 - Model: ResNet-50

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 64 - Model: ResNet-50

TensorFlow

Device: GPU - Batch Size: 1 - Model: GoogLeNet

clpeak

OpenCL Test: Double-Precision Double

LuxCoreRender

Scene: Rainbow Colors and Prism - Acceleration: GPU

Hashcat

Benchmark: SHA-512

Hashcat

Benchmark: SHA1

Hashcat

Benchmark: MD5

TensorFlow

Device: GPU - Batch Size: 1 - Model: AlexNet

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 1 - Model: Efficientnet_v2_l

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 16 - Model: ResNet-152

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 32 - Model: ResNet-152

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 32 - Model: ResNet-50

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 512 - Model: ResNet-50

Hashcat

Benchmark: TrueCrypt RIPEMD160 + XTS

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 1 - Model: ResNet-152

Rodinia

Test: OpenCL Particle Filter

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 16 - Model: ResNet-50

cl-mem

Benchmark: Copy

cl-mem

Benchmark: Read

cl-mem

Benchmark: Write

Hashcat

Benchmark: 7-Zip

PyTorch

Device: NVIDIA CUDA GPU - Batch Size: 1 - Model: ResNet-50

Waifu2x-NCNN Vulkan

Scale: 2x - Denoise: 3 - TAA: Yes

FinanceBench

Benchmark: Black-Scholes OpenCL

clpeak

OpenCL Test: Global Memory Bandwidth

MandelGPU

OpenCL Device: GPU

clpeak

OpenCL Test: Integer Compute INT

clpeak

OpenCL Test: Single-Precision Float

NeatBench

Acceleration: GPU

Phoronix Test Suite v10.8.5