12700k HPC+OpenCL AVX512 performance profiling Suite

12700k HPC+OpenCL AVX512 performance profiling Suite 1.0.0 System Test suite extracted from 12700k HPC+OpenCL AVX512 performance profiling. pts/mt-dgemm-1.2.0 Sustained Floating-Point Rate pts/amg-1.1.0 pts/arrayfire-1.1.0 blas_cpu Test: BLAS CPU pts/askap-2.1.0 tConvolveMT Test: tConvolve MT - Gridding pts/askap-2.1.0 tConvolveMT Test: tConvolve MT - Degridding pts/askap-2.1.0 tConvolveMPI Test: tConvolve MPI - Degridding pts/askap-2.1.0 tConvolveMPI Test: tConvolve MPI - Gridding pts/askap-2.1.0 tConvolveOMP Test: tConvolve OpenMP - Gridding pts/askap-2.1.0 tConvolveOMP Test: tConvolve OpenMP - Degridding pts/askap-2.1.0 tHogbomCleanOMP Test: Hogbom Clean OpenMP pts/caffe-1.5.0 --model=../models/bvlc_alexnet/deploy.prototxt -iterations 100 Model: AlexNet - Acceleration: CPU - Iterations: 100 pts/caffe-1.5.0 --model=../models/bvlc_alexnet/deploy.prototxt -iterations 200 Model: AlexNet - Acceleration: CPU - Iterations: 200 pts/caffe-1.5.0 --model=../models/bvlc_alexnet/deploy.prototxt -iterations 1000 Model: AlexNet - Acceleration: CPU - Iterations: 1000 pts/caffe-1.5.0 --model=../models/bvlc_googlenet/deploy.prototxt -iterations 100 Model: GoogleNet - Acceleration: CPU - Iterations: 100 pts/caffe-1.5.0 --model=../models/bvlc_googlenet/deploy.prototxt -iterations 200 Model: GoogleNet - Acceleration: CPU - Iterations: 200 pts/caffe-1.5.0 --model=../models/bvlc_googlenet/deploy.prototxt -iterations 1000 Model: GoogleNet - Acceleration: CPU - Iterations: 1000 pts/cl-mem-1.0.1 COPY Benchmark: Copy pts/cl-mem-1.0.1 READ Benchmark: Read pts/cl-mem-1.0.1 WRITE Benchmark: Write pts/cp2k-1.3.0 -i benchmarks/Fayalite-FIST/fayalite.inp Input: Fayalite-FIST system/darktable-1.0.5 bench.SRW output.jpg --core -d opencl -d perf Test: Boat - Acceleration: OpenCL system/darktable-1.0.5 masskrug.NEF output.jpg --core -d opencl -d perf Test: Masskrug - Acceleration: OpenCL system/darktable-1.0.5 server-rack.dng output.jpg --core -d opencl -d perf Test: Server Rack - Acceleration: OpenCL system/darktable-1.0.5 server_room.NEF output.jpg --core -d opencl -d perf Test: Server Room - Acceleration: OpenCL pts/daphne-1.0.0 OpenMP ndt_mapping Backend: OpenMP - Kernel: NDT Mapping pts/daphne-1.0.0 OpenMP points2image Backend: OpenMP - Kernel: Points2Image pts/daphne-1.0.0 OpenMP euclidean_cluster Backend: OpenMP - Kernel: Euclidean Cluster pts/deepspeech-1.0.0 CPU Acceleration: CPU pts/fftw-1.2.0 fftw-stock/tests/bench --time-repeat 100 -opatient ibc32 Build: Stock - Size: 1D FFT Size 32 pts/fftw-1.2.0 fftw-stock/tests/bench --time-repeat 100 -opatient ibc32x32 Build: Stock - Size: 2D FFT Size 32 pts/fftw-1.2.0 fftw-stock/tests/bench --time-repeat 100 -opatient ibc4096 Build: Stock - Size: 1D FFT Size 4096 pts/fftw-1.2.0 fftw-stock/tests/bench --time-repeat 100 -opatient ibc4096x4096 Build: Stock - Size: 2D FFT Size 4096 pts/fftw-1.2.0 fftw-mr/tests/bench --time-repeat 100 -opatient ibc32 Build: Float + SSE - Size: 1D FFT Size 32 pts/fftw-1.2.0 fftw-mr/tests/bench --time-repeat 100 -opatient ibc32x32 Build: Float + SSE - Size: 2D FFT Size 32 pts/fftw-1.2.0 fftw-mr/tests/bench --time-repeat 100 -opatient ibc4096 Build: Float + SSE - Size: 1D FFT Size 4096 pts/fftw-1.2.0 fftw-mr/tests/bench --time-repeat 100 -opatient ibc4096x4096 Build: Float + SSE - Size: 2D FFT Size 4096 system/octave-benchmark-1.0.1 pts/gromacs-1.6.0 mpi-build water-cut1.0_GMX50_bare/1536 Implementation: MPI CPU - Input: water_GMX50_bare pts/himeno-1.3.0 Poisson Pressure Solver pts/hpl-1.0.0 pts/intel-mpi-1.0.1 IMB-P2P PingPong Test: IMB-P2P PingPong pts/intel-mpi-1.0.1 IMB-MPI1 Exchange Test: IMB-MPI1 Exchange pts/intel-mpi-1.0.1 IMB-MPI1 PingPong Test: IMB-MPI1 PingPong pts/intel-mpi-1.0.1 IMB-MPI1 Sendrecv Test: IMB-MPI1 Sendrecv pts/lczero-1.6.0 -b blas Backend: BLAS pts/lulesh-1.1.1 pts/minife-1.0.0 -‐nx 264 --ny 256 -‐nz 256 Problem Size: Small pts/namd-1.2.1 ATPase Simulation - 327,506 Atoms pts/numpy-1.2.1 pts/onednn-1.7.0 --ip --batch=inputs/ip/shapes_1d --cfg=f32 --engine=cpu Harness: IP Shapes 1D - Data Type: f32 - Engine: CPU pts/onednn-1.7.0 --ip --batch=inputs/ip/shapes_3d --cfg=f32 --engine=cpu Harness: IP Shapes 3D - Data Type: f32 - Engine: CPU pts/onednn-1.7.0 --ip --batch=inputs/ip/shapes_1d --cfg=u8s8f32 --engine=cpu Harness: IP Shapes 1D - Data Type: u8s8f32 - Engine: CPU pts/onednn-1.7.0 --ip --batch=inputs/ip/shapes_3d --cfg=u8s8f32 --engine=cpu Harness: IP Shapes 3D - Data Type: u8s8f32 - Engine: CPU pts/onednn-1.7.0 --ip --batch=inputs/ip/shapes_1d --cfg=bf16bf16bf16 --engine=cpu Harness: IP Shapes 1D - Data Type: bf16bf16bf16 - Engine: CPU pts/onednn-1.7.0 --ip --batch=inputs/ip/shapes_3d --cfg=bf16bf16bf16 --engine=cpu Harness: IP Shapes 3D - Data Type: bf16bf16bf16 - Engine: CPU pts/onednn-1.7.0 --conv --batch=inputs/conv/shapes_auto --cfg=f32 --engine=cpu Harness: Convolution Batch Shapes Auto - Data Type: f32 - Engine: CPU pts/onednn-1.7.0 --deconv --batch=inputs/deconv/shapes_1d --cfg=f32 --engine=cpu Harness: Deconvolution Batch shapes_1d - Data Type: f32 - Engine: CPU pts/onednn-1.7.0 --deconv --batch=inputs/deconv/shapes_3d --cfg=f32 --engine=cpu Harness: Deconvolution Batch shapes_3d - Data Type: f32 - Engine: CPU pts/onednn-1.7.0 --conv --batch=inputs/conv/shapes_auto --cfg=u8s8f32 --engine=cpu Harness: Convolution Batch Shapes Auto - Data Type: u8s8f32 - Engine: CPU pts/onednn-1.7.0 --deconv --batch=inputs/deconv/shapes_1d --cfg=u8s8f32 --engine=cpu Harness: Deconvolution Batch shapes_1d - Data Type: u8s8f32 - Engine: CPU pts/onednn-1.7.0 --deconv --batch=inputs/deconv/shapes_3d --cfg=u8s8f32 --engine=cpu Harness: Deconvolution Batch shapes_3d - Data Type: u8s8f32 - Engine: CPU pts/onednn-1.7.0 --rnn --batch=inputs/rnn/perf_rnn_training --cfg=f32 --engine=cpu Harness: Recurrent Neural Network Training - Data Type: f32 - Engine: CPU pts/onednn-1.7.0 --rnn --batch=inputs/rnn/perf_rnn_inference_lb --cfg=f32 --engine=cpu Harness: Recurrent Neural Network Inference - Data Type: f32 - Engine: CPU pts/onednn-1.7.0 --rnn --batch=inputs/rnn/perf_rnn_training --cfg=u8s8f32 --engine=cpu Harness: Recurrent Neural Network Training - Data Type: u8s8f32 - Engine: CPU pts/onednn-1.7.0 --conv --batch=inputs/conv/shapes_auto --cfg=bf16bf16bf16 --engine=cpu Harness: Convolution Batch Shapes Auto - Data Type: bf16bf16bf16 - Engine: CPU pts/onednn-1.7.0 --deconv --batch=inputs/deconv/shapes_1d --cfg=bf16bf16bf16 --engine=cpu Harness: Deconvolution Batch shapes_1d - Data Type: bf16bf16bf16 - Engine: CPU pts/onednn-1.7.0 --deconv --batch=inputs/deconv/shapes_3d --cfg=bf16bf16bf16 --engine=cpu Harness: Deconvolution Batch shapes_3d - Data Type: bf16bf16bf16 - Engine: CPU pts/onednn-1.7.0 --rnn --batch=inputs/rnn/perf_rnn_inference_lb --cfg=u8s8f32 --engine=cpu Harness: Recurrent Neural Network Inference - Data Type: u8s8f32 - Engine: CPU pts/onednn-1.7.0 --matmul --batch=inputs/matmul/shapes_transformer --cfg=f32 --engine=cpu Harness: Matrix Multiply Batch Shapes Transformer - Data Type: f32 - Engine: CPU pts/onednn-1.7.0 --rnn --batch=inputs/rnn/perf_rnn_training --cfg=bf16bf16bf16 --engine=cpu Harness: Recurrent Neural Network Training - Data Type: bf16bf16bf16 - Engine: CPU pts/onednn-1.7.0 --rnn --batch=inputs/rnn/perf_rnn_inference_lb --cfg=bf16bf16bf16 --engine=cpu Harness: Recurrent Neural Network Inference - Data Type: bf16bf16bf16 - Engine: CPU pts/onednn-1.7.0 --matmul --batch=inputs/matmul/shapes_transformer --cfg=u8s8f32 --engine=cpu Harness: Matrix Multiply Batch Shapes Transformer - Data Type: u8s8f32 - Engine: CPU pts/onednn-1.7.0 --matmul --batch=inputs/matmul/shapes_transformer --cfg=bf16bf16bf16 --engine=cpu Harness: Matrix Multiply Batch Shapes Transformer - Data Type: bf16bf16bf16 - Engine: CPU pts/openfoam-1.0.1 Motorbike 150 60 60 Input: Motorbike 30M pts/openfoam-1.0.1 Motorbike 300 120 120 Input: Motorbike 60M pts/parboil-1.2.1 lbm omp_cpu long Test: OpenMP LBM pts/parboil-1.2.1 cutcp omp_base large Test: OpenMP CUTCP pts/parboil-1.2.1 stencil omp_base default Test: OpenMP Stencil pts/parboil-1.2.1 mri-gridding omp_base small Test: OpenMP MRI Gridding pts/pennant-1.1.0 sedovbig/sedovbig.pnt Test: sedovbig pts/pennant-1.1.0 leblancbig/leblancbig.pnt Test: leblancbig pts/qmcpack-1.3.1 H2O/example_H2O-1-1 simple-H2O.xml Input: simple-H2O pts/rbenchmark-1.0.3 pts/relion-1.0.1 --iter 1 --cpu --j 2 Test: Basic - Device: CPU pts/rnnoise-1.0.2 pts/shoc-1.2.0 -opencl -benchmark S3D Target: OpenCL - Benchmark: S3D pts/shoc-1.2.0 -opencl -benchmark Triad Target: OpenCL - Benchmark: Triad pts/shoc-1.2.0 -opencl -benchmark FFT Target: OpenCL - Benchmark: FFT SP pts/shoc-1.2.0 -opencl -benchmark MD5Hash Target: OpenCL - Benchmark: MD5 Hash pts/shoc-1.2.0 -opencl -benchmark Reduction Target: OpenCL - Benchmark: Reduction pts/shoc-1.2.0 -opencl -benchmark GEMM Target: OpenCL - Benchmark: GEMM SGEMM_N pts/shoc-1.2.0 -opencl -benchmark MaxFlops Target: OpenCL - Benchmark: Max SP Flops pts/shoc-1.2.0 -opencl -benchmark BusSpeedDownload Target: OpenCL - Benchmark: Bus Speed Download pts/shoc-1.2.0 -opencl -benchmark BusSpeedReadback Target: OpenCL - Benchmark: Bus Speed Readback pts/shoc-1.2.0 -opencl -benchmark DeviceMemory Target: OpenCL - Benchmark: Texture Read Bandwidth pts/tensorflow-lite-1.0.0 --graph=squeezenet.tflite Model: SqueezeNet pts/tensorflow-lite-1.0.0 --graph=inception_v4.tflite Model: Inception V4 pts/tensorflow-lite-1.0.0 --graph=nasnet_mobile.tflite Model: NASNet Mobile pts/tensorflow-lite-1.0.0 --graph=mobilenet_v1_1.0_224.tflite Model: Mobilenet Float pts/tensorflow-lite-1.0.0 --graph=mobilenet_v1_1.0_224_quant.tflite Model: Mobilenet Quant pts/tensorflow-lite-1.0.0 --graph=inception_resnet_v2.tflite Model: Inception ResNet V2 pts/hmmer-1.3.0 Pfam Database Search pts/mafft-1.6.2 Multiple Sequence Alignment - LSU RNA pts/mrbayes-1.5.0 Primate Phylogeny Analysis