OpenTransformer
/

llama.cpp-prismml

Model card Files Files and versions

llama.cpp-prismml / ggml

12.2 MB

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

OpenTransformer's picture

OpenTransformer

perf: maddubs kernel + nrc=4 multi-row for Q1_0_g128 (3.5-3.75 t/s)

570ff77 verified 2 months ago

cmake
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 2 months ago
include
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 2 months ago
src
perf: maddubs kernel + nrc=4 multi-row for Q1_0_g128 (3.5-3.75 t/s) 2 months ago
.gitignore

56 Bytes
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 2 months ago
CMakeLists.txt

20.9 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 2 months ago