llama cache

AMD Ryzen 9 5900HX testing with a ASUS ROG Strix G513QY_G513QY G513QY v1.0 (G513QY.318 BIOS) and ASUS AMD Cezanne 512MB on Ubuntu 22.10 via the Phoronix Test Suite.

HTML result view exported from: https://openbenchmarking.org/result/2401145-PTS-LLAMACAC05&sor&grt.

CacheBench

Test: Read

CacheBench

Test: Write

CacheBench

Test: Read / Modify / Write

Llama.cpp

Model: llama-2-7b.Q4_0.gguf

Llama.cpp

Model: llama-2-13b.Q4_0.gguf

Phoronix Test Suite v10.8.5