llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-08-14 04:17:53 -04:00

Files

R0CKSTAR 716301d1b0 musa: enable fp16 mma (all) and cublas on qy2 (#13842 )

* musa: enable fp16 mma (all) and cublas on qy2

Signed-off-by: Xiaodong Ye <xiaodong.ye@mthreads.com>

* Update ggml/src/ggml-cuda/ggml-cuda.cu

Co-authored-by: Johannes Gäßler <johannesg@5d6.de>

* Address review comments

Signed-off-by: Xiaodong Ye <xiaodong.ye@mthreads.com>

* Address review comments

Signed-off-by: Xiaodong Ye <xiaodong.ye@mthreads.com>

* musa: disable MUL_MAT_ID (q2_k × f32) due to precision issues

Signed-off-by: Xiaodong Ye <xiaodong.ye@mthreads.com>

---------

Signed-off-by: Xiaodong Ye <xiaodong.ye@mthreads.com>
Co-authored-by: Johannes Gäßler <johannesg@5d6.de>

2025-06-26 12:11:59 +08:00

cmake

ggml-cpu : rework weak alias on apple targets (#14146 )

2025-06-16 13:54:15 +08:00

include

ggml-cpu: enable IBM NNPA Vector Intrinsics (#14317 )

2025-06-25 23:49:04 +02:00

src

musa: enable fp16 mma (all) and cublas on qy2 (#13842 )

2025-06-26 12:11:59 +08:00

.gitignore

…

CMakeLists.txt

ggml-cpu: enable IBM NNPA Vector Intrinsics (#14317 )

2025-06-25 23:49:04 +02:00