llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-09-05 14:56:19 -04:00

Files

Johannes Gäßler 0cf6725e9f CUDA: FA support for Deepseek (Ampere or newer) (#13306 )

* CUDA: FA support for Deepseek (Ampere or newer)

* do loop unrolling via C++ template

2025-05-09 13:34:58 +02:00

2025-03-27 10:09:29 +02:00

2025-05-06 13:58:51 +02:00

2025-05-09 13:34:58 +02:00

.gitignore

2024-07-13 18:12:39 +02:00

CMakeLists.txt

2025-05-07 17:28:36 +03:00