gpu_compute_nvidia1_run0
Intel Core i7-12700K testing with a Gigabyte B660 DS3H DDR4 (F4 BIOS) and Gigabyte NVIDIA GeForce RTX 3070 8GB on Ubuntu 22.04 via the Phoronix Test Suite.


gpu_compute_1_0: 

	Processor: Intel Core i7-12700K @ 4.90GHz (12 Cores / 20 Threads), Motherboard: Gigabyte B660 DS3H DDR4 (F4 BIOS), Chipset: Intel Device 7aa7, Memory: 64GB, Disk: 2000GB PNY CS2130 2TB SSD + 4 x 6001GB Western Digital WD60EZAZ-00S, Graphics: Gigabyte NVIDIA GeForce RTX 3070 8GB, Audio: Realtek ALC897, Monitor: BenQ PD2700U, Network: Realtek RTL8111/8168/8411

	OS: Ubuntu 22.04, Kernel: 5.15.0-70-generic (x86_64), Desktop: GNOME Shell 42.5, Display Server: X Server 1.21.1.4, Display Driver: NVIDIA 530.41.03, OpenGL: 4.6.0, OpenCL: OpenCL 3.0 CUDA 12.1.98, Vulkan: 1.3.236, Compiler: GCC 11.3.0 + CUDA 11.5, File-System: ext4, Screen Resolution: 3840x2160


vkpeak 20210424
fp32-scalar
GFLOPS > Higher Is Better
gpu_compute_1_0 . 11248.76 |===================================================


vkpeak 20210424
fp32-vec4
GFLOPS > Higher Is Better
gpu_compute_1_0 . 14887.96 |===================================================


vkpeak 20210424
fp16-scalar
GFLOPS > Higher Is Better
gpu_compute_1_0 . 11255.49 |===================================================


vkpeak 20210424
fp16-vec4
GFLOPS > Higher Is Better
gpu_compute_1_0 . 22223.36 |===================================================


vkpeak 20210424
fp64-scalar
GFLOPS > Higher Is Better
gpu_compute_1_0 . 352.99 |=====================================================


vkpeak 20210424
fp64-vec4
GFLOPS > Higher Is Better
gpu_compute_1_0 . 353.36 |=====================================================


vkpeak 20210424
int32-scalar
GIOPS > Higher Is Better
gpu_compute_1_0 . 11217.56 |===================================================


vkpeak 20210424
int32-vec4
GIOPS > Higher Is Better
gpu_compute_1_0 . 11170.38 |===================================================


vkpeak 20210424
int16-scalar
GIOPS > Higher Is Better
gpu_compute_1_0 . 7409.34 |====================================================


vkpeak 20210424
int16-vec4
GIOPS > Higher Is Better
gpu_compute_1_0 . 9837.29 |====================================================


RealSR-NCNN 20200818
Scale: 4x - TAA: No
Seconds < Lower Is Better
gpu_compute_1_0 . 8.220 |======================================================


RealSR-NCNN 20200818
Scale: 4x - TAA: Yes
Seconds < Lower Is Better
gpu_compute_1_0 . 48.86 |======================================================


Waifu2x-NCNN Vulkan 20200818
Scale: 2x - Denoise: 3 - TAA: No
Seconds < Lower Is Better


Waifu2x-NCNN Vulkan 20200818
Scale: 2x - Denoise: 3 - TAA: Yes
Seconds < Lower Is Better
gpu_compute_1_0 . 4.162 |======================================================


VkFFT 1.1.1

Benchmark Score > Higher Is Better
gpu_compute_1_0 . 32563 |======================================================


Hashcat 6.2.4
Benchmark: MD5
H/s > Higher Is Better
gpu_compute_1_0 . 79917100000 |================================================


Hashcat 6.2.4
Benchmark: SHA1
H/s > Higher Is Better
gpu_compute_1_0 . 25055033333 |================================================


Hashcat 6.2.4
Benchmark: 7-Zip
H/s > Higher Is Better
gpu_compute_1_0 . 1244700 |====================================================


Hashcat 6.2.4
Benchmark: SHA-512
H/s > Higher Is Better
gpu_compute_1_0 . 3652700000 |=================================================


Hashcat 6.2.4
Benchmark: TrueCrypt RIPEMD160 + XTS
H/s > Higher Is Better
gpu_compute_1_0 . 957867 |=====================================================


Mixbench 2020-06-23
Backend: OpenCL - Benchmark: Integer
GIOPS > Higher Is Better
gpu_compute_1_0 . 11118.02 |===================================================


Mixbench 2020-06-23
Backend: NVIDIA CUDA - Benchmark: Integer
GIOPS > Higher Is Better
gpu_compute_1_0 . 9818.92 |====================================================


Mixbench 2020-06-23
Backend: OpenCL - Benchmark: Double Precision
GFLOPS > Higher Is Better
gpu_compute_1_0 . 298.81 |=====================================================


Mixbench 2020-06-23
Backend: OpenCL - Benchmark: Single Precision
GFLOPS > Higher Is Better
gpu_compute_1_0 . 21840.61 |===================================================


Mixbench 2020-06-23
Backend: NVIDIA CUDA - Benchmark: Half Precision
GFLOPS > Higher Is Better
gpu_compute_1_0 . 22097.96 |===================================================


Mixbench 2020-06-23
Backend: NVIDIA CUDA - Benchmark: Double Precision
GFLOPS > Higher Is Better
gpu_compute_1_0 . 295.70 |=====================================================


Mixbench 2020-06-23
Backend: NVIDIA CUDA - Benchmark: Single Precision
GFLOPS > Higher Is Better
gpu_compute_1_0 . 21050.32 |===================================================


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: S3D


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: Triad


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: FFT SP


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: MD5 Hash


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: Reduction


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: GEMM SGEMM_N


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: Max SP Flops


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: Bus Speed Download


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: Bus Speed Readback


SHOC Scalable HeterOgeneous Computing 2020-04-17
Target: OpenCL - Benchmark: Texture Read Bandwidth


Libplacebo 5.229.1

FPS > Higher Is Better


cl-mem 2017-01-13
Benchmark: Copy
GB/s > Higher Is Better
gpu_compute_1_0 . 296.1 |======================================================


cl-mem 2017-01-13
Benchmark: Read
GB/s > Higher Is Better
gpu_compute_1_0 . 395.1 |======================================================


cl-mem 2017-01-13
Benchmark: Write
GB/s > Higher Is Better
gpu_compute_1_0 . 388.5 |======================================================


NAMD CUDA 2.14
ATPase Simulation - 327,506 Atoms
days/ns < Lower Is Better
gpu_compute_1_0 . 0.34911 |====================================================


Betsy GPU Compressor 1.1 Beta
Codec: ETC1 - Quality: Highest
Seconds < Lower Is Better


Betsy GPU Compressor 1.1 Beta
Codec: ETC2 RGB - Quality: Highest
Seconds < Lower Is Better


VkResample 1.0
Upscale: 2x - Precision: Double
ms < Lower Is Better
gpu_compute_1_0 . 217.29 |=====================================================


VkResample 1.0
Upscale: 2x - Precision: Single
ms < Lower Is Better
gpu_compute_1_0 . 17.39 |======================================================


OctaneBench 2020.1
Total Score
Score > Higher Is Better
gpu_compute_1_0 . 406.19 |=====================================================


RedShift Demo 3.0

Seconds < Lower Is Better


FAHBench 2.3.2

Ns Per Day > Higher Is Better
gpu_compute_1_0 . 253.33 |=====================================================


clpeak 1.1.2
OpenCL Test: Integer Compute INT
GIOPS > Higher Is Better
gpu_compute_1_0 . 10064.62 |===================================================


clpeak 1.1.2
OpenCL Test: Single-Precision Float
GFLOPS > Higher Is Better
gpu_compute_1_0 . 19624.76 |===================================================


clpeak 1.1.2
OpenCL Test: Double-Precision Double
GFLOPS > Higher Is Better
gpu_compute_1_0 . 354.21 |=====================================================


clpeak 1.1.2
OpenCL Test: Global Memory Bandwidth
GBPS > Higher Is Better
gpu_compute_1_0 . 390.84 |=====================================================


LeelaChessZero 0.28
Backend: OpenCL
Nodes Per Second > Higher Is Better
gpu_compute_1_0 . 12008 |======================================================


Rodinia 3.1
Test: OpenCL Particle Filter
Seconds < Lower Is Better
gpu_compute_1_0 . 6.116 |======================================================


ArrayFire 3.7
Test: Conjugate Gradient OpenCL
ms < Lower Is Better
gpu_compute_1_0 . 2.107 |======================================================


LuxCoreRender 2.6
Scene: DLSC - Acceleration: GPU
M samples/sec > Higher Is Better
gpu_compute_1_0 . 16.40 |======================================================


LuxCoreRender 2.6
Scene: Danish Mood - Acceleration: GPU
M samples/sec > Higher Is Better
gpu_compute_1_0 . 10.06 |======================================================


LuxCoreRender 2.6
Scene: Orange Juice - Acceleration: GPU
M samples/sec > Higher Is Better
gpu_compute_1_0 . 14.02 |======================================================


LuxCoreRender 2.6
Scene: LuxCore Benchmark - Acceleration: GPU
M samples/sec > Higher Is Better
gpu_compute_1_0 . 12.46 |======================================================


LuxCoreRender 2.6
Scene: Rainbow Colors and Prism - Acceleration: GPU
M samples/sec > Higher Is Better
gpu_compute_1_0 . 35.86 |======================================================


FinanceBench 2016-07-25
Benchmark: Black-Scholes OpenCL
ms < Lower Is Better
gpu_compute_1_0 . 9.806 |======================================================


ViennaCL 1.7.1
Test: CPU BLAS - sCOPY
GB/s > Higher Is Better
gpu_compute_1_0 . 45.6 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - sAXPY
GB/s > Higher Is Better
gpu_compute_1_0 . 47.8 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - sDOT
GB/s > Higher Is Better
gpu_compute_1_0 . 50.8 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dCOPY
GB/s > Higher Is Better
gpu_compute_1_0 . 34.2 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dAXPY
GB/s > Higher Is Better
gpu_compute_1_0 . 36.9 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dDOT
GB/s > Higher Is Better
gpu_compute_1_0 . 38.4 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dGEMV-N
GB/s > Higher Is Better
gpu_compute_1_0 . 40.4 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dGEMV-T
GB/s > Higher Is Better
gpu_compute_1_0 . 43.0 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dGEMM-NN
GFLOPs/s > Higher Is Better
gpu_compute_1_0 . 59.3 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dGEMM-NT
GFLOPs/s > Higher Is Better
gpu_compute_1_0 . 58.7 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dGEMM-TN
GFLOPs/s > Higher Is Better
gpu_compute_1_0 . 62.2 |=======================================================


ViennaCL 1.7.1
Test: CPU BLAS - dGEMM-TT
GFLOPs/s > Higher Is Better
gpu_compute_1_0 . 62.1 |=======================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - sCOPY
GB/s > Higher Is Better
gpu_compute_1_0 . 286 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - sAXPY
GB/s > Higher Is Better
gpu_compute_1_0 . 361 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - sDOT
GB/s > Higher Is Better
gpu_compute_1_0 . 329 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - dCOPY
GB/s > Higher Is Better
gpu_compute_1_0 . 377 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - dAXPY
GB/s > Higher Is Better
gpu_compute_1_0 . 400 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - dDOT
GB/s > Higher Is Better
gpu_compute_1_0 . 402 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - dGEMV-N
GB/s > Higher Is Better
gpu_compute_1_0 . 176 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - dGEMV-T
GB/s > Higher Is Better
gpu_compute_1_0 . 333 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - dGEMM-NN
GFLOPs/s > Higher Is Better
gpu_compute_1_0 . 332 |========================================================


ViennaCL 1.7.1
Test: OpenCL BLAS - dGEMM-TN
GFLOPs/s > Higher Is Better
gpu_compute_1_0 . 330 |========================================================


GROMACS 2023
Implementation: NVIDIA CUDA GPU - Input: water_GMX50_bare
Ns Per Day > Higher Is Better


Caffe 2020-02-13
Model: AlexNet - Acceleration: NVIDIA CUDA  - Iterations: 100
Milli-Seconds < Lower Is Better


Caffe 2020-02-13
Model: AlexNet - Acceleration: NVIDIA CUDA  - Iterations: 200
Milli-Seconds < Lower Is Better


Caffe 2020-02-13
Model: AlexNet - Acceleration: NVIDIA CUDA  - Iterations: 1000
Milli-Seconds < Lower Is Better


Caffe 2020-02-13
Model: GoogleNet - Acceleration: NVIDIA CUDA  - Iterations: 100
Milli-Seconds < Lower Is Better


Caffe 2020-02-13
Model: GoogleNet - Acceleration: NVIDIA CUDA  - Iterations: 200
Milli-Seconds < Lower Is Better


Caffe 2020-02-13
Model: GoogleNet - Acceleration: NVIDIA CUDA  - Iterations: 1000
Milli-Seconds < Lower Is Better


NCNN 20220729
Target: Vulkan GPU
ms < Lower Is Better


PlaidML
FP16: No - Mode: Training - Network: Mobilenet - Device: OpenCL
Examples Per Second > Higher Is Better


PlaidML
FP16: No - Mode: Inference - Network: IMDB LSTM - Device: OpenCL
Examples Per Second > Higher Is Better


PlaidML
FP16: No - Mode: Inference - Network: Mobilenet - Device: OpenCL
Examples Per Second > Higher Is Better


PlaidML
FP16: Yes - Mode: Inference - Network: Mobilenet - Device: OpenCL
Examples Per Second > Higher Is Better


PlaidML
FP16: No - Mode: Inference - Network: DenseNet 201 - Device: OpenCL
Examples Per Second > Higher Is Better


Blender 3.5
Blend File: BMW27 - Compute: NVIDIA OptiX
Seconds < Lower Is Better
gpu_compute_1_0 . 5.36 |=======================================================


Blender 3.5
Blend File: Classroom - Compute: NVIDIA OptiX
Seconds < Lower Is Better
gpu_compute_1_0 . 12.65 |======================================================


Blender 3.5
Blend File: Fishy Cat - Compute: NVIDIA OptiX
Seconds < Lower Is Better
gpu_compute_1_0 . 10.46 |======================================================


Blender 3.5
Blend File: Barbershop - Compute: NVIDIA OptiX
Seconds < Lower Is Better
gpu_compute_1_0 . 49.78 |======================================================


Blender 3.5
Blend File: Pabellon Barcelona - Compute: NVIDIA OptiX
Seconds < Lower Is Better
gpu_compute_1_0 . 14.21 |======================================================


IndigoBench 4.4
Acceleration: OpenCL GPU - Scene: Bedroom
M samples/s > Higher Is Better
gpu_compute_1_0 . 25.86 |======================================================


IndigoBench 4.4
Acceleration: OpenCL GPU - Scene: Supercar
M samples/s > Higher Is Better
gpu_compute_1_0 . 70.62 |======================================================


MandelGPU 1.3pts1
OpenCL Device: GPU
Samples/sec > Higher Is Better
gpu_compute_1_0 . 220704201.9 |================================================


NeatBench 5
Acceleration: GPU
FPS > Higher Is Better
gpu_compute_1_0 . 3070 |=======================================================