OpenCL ROCm 2.0 vs. AMDGPU-PRO Linux

Radeon RX Vega 64 ROCm 2.0 OpenCL versus PAL OpenCL driver in AMDGPU-PRO 18.50. Benchmarks by Michael Larabel for a future article on Phoronix.com.

HTML result view exported from: https://openbenchmarking.org/result/1901167-PTS-OPENCLRO89&sor&gru.

PlaidML

FP16: No - Mode: Inference - Network: IMDB LSTM - Device: OpenCL

PlaidML

FP16: No - Mode: Inference - Network: Mobilenet - Device: OpenCL

PlaidML

FP16: No - Mode: Inference - Network: ResNet 50 - Device: OpenCL

PlaidML

FP16: No - Mode: Inference - Network: Inception V3 - Device: OpenCL

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Triad

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Bus Speed Download

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Bus Speed Readback

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: Texture Read Bandwidth

cl-mem

Benchmark: Copy

cl-mem

Benchmark: Read

cl-mem

Benchmark: Write

clpeak

OpenCL Test: Global Memory Bandwidth

clpeak

OpenCL Test: Transfer Bandwidth enqueueReadBuffer

clpeak

OpenCL Test: Transfer Bandwidth enqueueWriteBuffer

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: FFT SP

clpeak

OpenCL Test: Single-Precision Float

clpeak

OpenCL Test: Double-Precision Double

SHOC Scalable HeterOgeneous Computing

Target: OpenCL - Benchmark: MD5 Hash

clpeak

OpenCL Test: Integer Compute INT

LeelaChessZero

Backend: OpenCL

JuliaGPU

OpenCL Device: GPU

Rodinia

Test: OpenCL Heartwall

Darktable

Test: Boat - Acceleration: OpenCL

Darktable

Test: Masskrug - Acceleration: OpenCL

Darktable

Test: Server Rack - Acceleration: OpenCL

Darktable

Test: Server Room - Acceleration: OpenCL

clpeak

OpenCL Test: Kernel Latency

Phoronix Test Suite v10.8.5