llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-07-30 14:13:57 -04:00

Files

fj-y-saito c67cc9837d ggml: aarch64: implement SVE kernels for q4_K_q8_K vector dot (#11227 )

* Add SVE support for q4_K_q8_K

* Update ggml/src/ggml-cpu/ggml-cpu-quants.c

change to use K_SCALE_SIZE

Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

---------

Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

2025-01-16 11:11:49 +02:00

include

RoPE: fix back, CUDA support for back + noncont. (#11240 )

2025-01-15 12:51:37 +01:00

src

ggml: aarch64: implement SVE kernels for q4_K_q8_K vector dot (#11227 )

2025-01-16 11:11:49 +02:00

.gitignore

vulkan : cmake integration (#8119 )

2024-07-13 18:12:39 +02:00

CMakeLists.txt

fix: ggml: fix vulkan-shaders-gen build (#10448 )

2025-01-15 14:17:42 +01:00