llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-09-01 21:04:58 -04:00

Files

Georgi Gerganov f0995d28ce metal : use FA-vec kernel up to batch size 20 (#13496 )

* batched-bench : fix pp batch contents

* metal : optimize multi-sequence FA vec kernel

ggml-ci

* metal : use FA-vec kernel up to batch size 20

ggml-ci

2025-05-13 18:04:39 +03:00

cmake

…

include

llama/ggml: add LLM training support (#10544 )

2025-05-12 14:44:49 +02:00

src

metal : use FA-vec kernel up to batch size 20 (#13496 )

2025-05-13 18:04:39 +03:00

.gitignore

…

CMakeLists.txt

whisper: remove MSVC warnings pragmas (whisper/3090)

2025-05-07 17:28:36 +03:00