llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-07-09 13:02:12 +00:00

Files

Georgi Gerganov 9067487c44 ggml : fix FA mask dim 2 and 3 (#14505 )

* ggml : fix FA mask dim 2 and 3

ggml-ci

* backends : unsupport batched FA in CUDA and Vulkan

ggml-ci

* vulkan : disable FA for mask->ne[2] != 1

2025-07-03 10:46:57 +03:00

ggml-alloc.h

2025-02-28 14:41:47 +01:00

ggml-backend.h

2025-06-29 09:43:36 +02:00

ggml-blas.h

…

ggml-cann.h

…

ggml-cpp.h

2025-05-01 09:58:44 +03:00

ggml-cpu.h

2025-06-27 16:41:40 +03:00

ggml-cuda.h

…

ggml-metal.h

…

ggml-opencl.h

…

ggml-opt.h

2025-05-19 13:29:56 +03:00

ggml-rpc.h

2025-04-25 10:08:08 +03:00

ggml-sycl.h

…

ggml-vulkan.h

…

ggml.h

2025-07-03 10:46:57 +03:00

gguf.h

…