RTX 30 Compute September Suite

RTX 30 Compute September Suite 1.0.0 System Test suite extracted from RTX 30 Compute September. pts/shoc-1.2.0 -opencl -benchmark GEMM Target: OpenCL - Benchmark: GEMM SGEMM_N pts/cl-mem-1.0.1 READ Benchmark: Read pts/shoc-1.2.0 -opencl -benchmark FFT Target: OpenCL - Benchmark: FFT SP pts/shoc-1.2.0 -opencl -benchmark S3D Target: OpenCL - Benchmark: S3D pts/cl-mem-1.0.1 WRITE Benchmark: Write pts/vkresample-1.0.0 -u 2 -p 0 Upscale: 2x - Precision: Single pts/vkpeak-1.0.2 fp32-scalar pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dAXPY pts/vkpeak-1.0.2 fp16-vec4 pts/vkpeak-1.0.2 fp32-vec4 pts/vkpeak-1.0.2 fp64-scalar pts/vkpeak-1.0.2 int32-scalar pts/vkpeak-1.0.2 fp16-scalar pts/vkresample-1.0.0 -u 2 -p 1 Upscale: 2x - Precision: Double pts/vkpeak-1.0.2 int32-vec4 pts/vkpeak-1.0.2 int16-scalar pts/vkpeak-1.0.2 fp64-vec4 pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dGEMM-TN pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dGEMM-NT pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dGEMM-NN pts/blender-1.9.0 -b ../fishy_cat_gpu.blend -o output.test -x 1 -F JPEG -f 1 OPTIX Blend File: Fishy Cat - Compute: NVIDIA OptiX pts/luxcorerender-1.3.0 LuxCore2.1Benchmark/LuxCoreScene/render.cfg -D renderengine.type PATHOCL -D opencl.native.threads.count 0 -D context.cuda.optix.enable 0 Scene: LuxCore Benchmark - Acceleration: GPU pts/shoc-1.2.0 -opencl -benchmark MD5Hash Target: OpenCL - Benchmark: MD5 Hash pts/shoc-1.2.0 -opencl -benchmark MaxFlops Target: OpenCL - Benchmark: Max SP Flops pts/hashcat-1.0.0 -m 100 Benchmark: SHA1 pts/luxcorerender-1.3.0 DLSC/LuxCoreScene/render.cfg -D renderengine.type PATHOCL -D opencl.native.threads.count 0 -D context.cuda.optix.enable 0 Scene: DLSC - Acceleration: GPU pts/hashcat-1.0.0 -m 1700 Benchmark: SHA-512 pts/hashcat-1.0.0 -m 0 Benchmark: MD5 pts/hashcat-1.0.0 -m 6211 Benchmark: TrueCrypt RIPEMD160 + XTS pts/luxcorerender-1.3.0 DanishMood/LuxCoreScene/render.cfg -D renderengine.type PATHOCL -D opencl.native.threads.count 0 -D context.cuda.optix.enable 0 Scene: Danish Mood - Acceleration: GPU pts/hashcat-1.0.0 -m 11600 Benchmark: 7-Zip pts/vkpeak-1.0.2 int16-vec4 pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dDOT pts/blender-1.9.0 -b ../bmw27_gpu.blend -o output.test -x 1 -F JPEG -f 1 OPTIX Blend File: BMW27 - Compute: NVIDIA OptiX pts/realsr-ncnn-1.0.0 -s 4 -x Scale: 4x - TAA: Yes pts/octanebench-1.3.0 Total Score pts/financebench-1.1.1 Black-Scholes/OpenCL/blackScholesAnalyticEngine.exe Benchmark: Black-Scholes OpenCL pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dCOPY pts/redshift-1.0.1 pts/indigobench-1.1.0 --gpuonly --scenes bedroom Acceleration: OpenCL GPU - Scene: Bedroom pts/rodinia-1.3.1 OCL_PARTICLEFILTER Test: OpenCL Particle Filter pts/blender-1.9.0 -b ../classroom_gpu.blend -o output.test -x 1 -F JPEG -f 1 OPTIX Blend File: Classroom - Compute: NVIDIA OptiX pts/blender-1.9.0 -b ../bmw27_gpu.blend -o output.test -x 1 -F JPEG -f 1 CUDA Blend File: BMW27 - Compute: CUDA pts/blender-1.9.0 -b ../fishy_cat_gpu.blend -o output.test -x 1 -F JPEG -f 1 CUDA Blend File: Fishy Cat - Compute: CUDA pts/luxcorerender-1.3.0 RainbowColorsAndPrism/LuxCoreScene/render.cfg -D renderengine.type PATHOCL -D opencl.native.threads.count 0 -D context.cuda.optix.enable 0 Scene: Rainbow Colors and Prism - Acceleration: GPU pts/luxcorerender-1.3.0 OrangeJuice/LuxCoreScene/render.cfg -D renderengine.type PATHOCL -D opencl.native.threads.count 0 -D context.cuda.optix.enable 0 Scene: Orange Juice - Acceleration: GPU pts/blender-1.9.0 -b ../classroom_gpu.blend -o output.test -x 1 -F JPEG -f 1 CUDA Blend File: Classroom - Compute: CUDA pts/indigobench-1.1.0 --gpuonly --scenes supercar Acceleration: OpenCL GPU - Scene: Supercar pts/lczero-1.6.0 -b opencl Backend: OpenCL pts/vkfft-1.1.0 pts/arrayfire-1.1.0 cg_opencl Test: Conjugate Gradient OpenCL pts/realsr-ncnn-1.0.0 -s 4 Scale: 4x - TAA: No pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - sAXPY pts/blender-1.9.0 -b ../barbershop_interior_gpu.blend -o output.test -x 1 -F JPEG -f 1 CUDA Blend File: Barbershop - Compute: CUDA pts/fahbench-1.0.2 pts/waifu2x-ncnn-1.0.0 -s 2 -n 3 -x Scale: 2x - Denoise: 3 - TAA: Yes pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - sCOPY pts/ncnn-1.3.0 Target: Vulkan GPU - Model: vgg16 pts/cl-mem-1.0.1 COPY Benchmark: Copy pts/shoc-1.2.0 -opencl -benchmark Reduction Target: OpenCL - Benchmark: Reduction pts/ncnn-1.3.0 Target: Vulkan GPU - Model: yolov4-tiny pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dGEMV-T pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dDOT pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - sAXPY pts/ncnn-1.3.0 Target: Vulkan GPU - Model: blazeface pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - sDOT pts/ncnn-1.3.0 Target: Vulkan GPU - Model: resnet18 pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - sDOT pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dCOPY pts/ncnn-1.3.0 Target: Vulkan GPU-v3-v3 - Model: mobilenet-v3 pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dGEMV-T pts/ncnn-1.3.0 Target: Vulkan GPU - Model: googlenet pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dGEMV-N pts/ncnn-1.3.0 Target: Vulkan GPU - Model: mnasnet pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dGEMV-N pts/ncnn-1.3.0 Target: Vulkan GPU - Model: regnety_400m pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - sCOPY pts/ncnn-1.3.0 Target: Vulkan GPU - Model: efficientnet-b0 pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dAXPY pts/namd-cuda-1.1.1 ATPase Simulation - 327,506 Atoms pts/shoc-1.2.0 -opencl -benchmark DeviceMemory Target: OpenCL - Benchmark: Texture Read Bandwidth pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dGEMM-TT pts/ncnn-1.3.0 Target: Vulkan GPU - Model: mobilenet pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dGEMM-TN pts/ncnn-1.3.0 Target: Vulkan GPU - Model: alexnet pts/ncnn-1.3.0 Target: Vulkan GPU-v2-v2 - Model: mobilenet-v2 pts/ncnn-1.3.0 Target: Vulkan GPU - Model: shufflenet-v2 pts/shoc-1.2.0 -opencl -benchmark Triad Target: OpenCL - Benchmark: Triad pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dGEMM-NT pts/ncnn-1.3.0 Target: Vulkan GPU - Model: resnet50 pts/ncnn-1.3.0 Target: Vulkan GPU - Model: squeezenet_ssd pts/viennacl-1.1.0 dense_blas-bench-cpu Test: CPU BLAS - dGEMM-NN pts/shoc-1.2.0 -opencl -benchmark BusSpeedReadback Target: OpenCL - Benchmark: Bus Speed Readback pts/shoc-1.2.0 -opencl -benchmark BusSpeedDownload Target: OpenCL - Benchmark: Bus Speed Download pts/viennacl-1.1.0 dense_blas-bench-opencl Test: OpenCL BLAS - dGEMM-TT pts/plaidml-1.0.4 --no-fp16 --no-train densenet201 OPENCL FP16: No - Mode: Inference - Network: DenseNet 201 - Device: OpenCL pts/plaidml-1.0.4 --fp16 --no-train mobilenet OPENCL FP16: Yes - Mode: Inference - Network: Mobilenet - Device: OpenCL pts/plaidml-1.0.4 --no-fp16 --no-train mobilenet OPENCL FP16: No - Mode: Inference - Network: Mobilenet - Device: OpenCL pts/plaidml-1.0.4 --no-fp16 --no-train imdb_lstm OPENCL FP16: No - Mode: Inference - Network: IMDB LSTM - Device: OpenCL pts/plaidml-1.0.4 --no-fp16 --train mobilenet OPENCL FP16: No - Mode: Training - Network: Mobilenet - Device: OpenCL pts/caffe-1.5.0 --model=../models/bvlc_googlenet/deploy.prototxt -gpu all -iterations 1000 Model: GoogleNet - Acceleration: NVIDIA CUDA - Iterations: 1000 pts/caffe-1.5.0 --model=../models/bvlc_googlenet/deploy.prototxt -gpu all -iterations 200 Model: GoogleNet - Acceleration: NVIDIA CUDA - Iterations: 200 pts/caffe-1.5.0 --model=../models/bvlc_googlenet/deploy.prototxt -gpu all -iterations 100 Model: GoogleNet - Acceleration: NVIDIA CUDA - Iterations: 100 pts/caffe-1.5.0 --model=../models/bvlc_alexnet/deploy.prototxt -gpu all -iterations 1000 Model: AlexNet - Acceleration: NVIDIA CUDA - Iterations: 1000 pts/caffe-1.5.0 --model=../models/bvlc_alexnet/deploy.prototxt -gpu all -iterations 200 Model: AlexNet - Acceleration: NVIDIA CUDA - Iterations: 200 pts/caffe-1.5.0 --model=../models/bvlc_alexnet/deploy.prototxt -gpu all -iterations 100 Model: AlexNet - Acceleration: NVIDIA CUDA - Iterations: 100 pts/gromacs-1.6.0 cuda-build water-cut1.0_GMX50_bare/1536 Implementation: NVIDIA CUDA GPU - Input: water_GMX50_bare pts/betsy-1.0.0 --codec=etc2_rgb --quality=2 Codec: ETC2 RGB - Quality: Highest pts/betsy-1.0.0 --codec=etc1 --quality=2 Codec: ETC1 - Quality: Highest pts/libplacebo-1.0.0 pts/mixbench-1.1.1 mixbench-cuda-ro SPGFLOPS Backend: NVIDIA CUDA - Benchmark: Single Precision pts/mixbench-1.1.1 mixbench-cuda-ro DPGFLOPS Backend: NVIDIA CUDA - Benchmark: Double Precision pts/mixbench-1.1.1 mixbench-cuda-ro HPGFLOPS Backend: NVIDIA CUDA - Benchmark: Half Precision pts/mixbench-1.1.1 mixbench-ocl-ro SPGFLOPS Backend: OpenCL - Benchmark: Single Precision pts/mixbench-1.1.1 mixbench-ocl-ro DPGFLOPS Backend: OpenCL - Benchmark: Double Precision pts/mixbench-1.1.1 mixbench-cuda-ro GIOPS Backend: NVIDIA CUDA - Benchmark: Integer pts/mixbench-1.1.1 mixbench-ocl-ro GIOPS Backend: OpenCL - Benchmark: Integer pts/waifu2x-ncnn-1.0.0 -s 2 -n 3 Scale: 2x - Denoise: 3 - TAA: No