This website requires JavaScript.
Explore
Help
Sign In
tqcq
/
llama.cpp
Watch
0
Star
0
Fork
0
You've already forked llama.cpp
mirror of
https://github.com/ggml-org/llama.cpp.git
synced
2025-07-19 17:17:40 +00:00
Code
Issues
Packages
Projects
Releases
Wiki
Activity
Files
55a1c5a5fdefef808e95aabd3d5563af1068cc80
llama.cpp
/
ggml
/
src
/
ggml-cuda
History
…
..
template-instances
…
vendors
…
acc.cu
…
acc.cuh
…
arange.cu
…
arange.cuh
…
argmax.cu
…
argmax.cuh
…
argsort.cu
…
argsort.cuh
…
binbcast.cu
…
binbcast.cuh
…
clamp.cu
…
clamp.cuh
…
CMakeLists.txt
…
common.cuh
…
concat.cu
…
concat.cuh
…
conv2d-dw.cu
…
conv2d-dw.cuh
…
conv2d-transpose.cu
…
conv2d-transpose.cuh
…
conv-transpose-1d.cu
…
conv-transpose-1d.cuh
…
convert.cu
…
convert.cuh
…
count-equal.cu
…
count-equal.cuh
…
cp-async.cuh
…
cpy.cu
…
cpy.cuh
…
cross-entropy-loss.cu
…
cross-entropy-loss.cuh
…
dequantize.cuh
…
diagmask.cu
…
diagmask.cuh
…
fattn-common.cuh
…
fattn-mma-f16.cuh
…
fattn-tile-f16.cu
…
fattn-tile-f16.cuh
…
fattn-tile-f32.cu
…
fattn-tile-f32.cuh
…
fattn-vec-f16.cuh
…
fattn-vec-f32.cuh
…
fattn-wmma-f16.cu
…
fattn-wmma-f16.cuh
…
fattn.cu
…
fattn.cuh
…
getrows.cu
…
getrows.cuh
…
ggml-cuda.cu
CUDA: add softmax broadcast (
#14475
)
2025-07-02 15:48:33 +03:00
gla.cu
…
gla.cuh
…
im2col.cu
…
im2col.cuh
…
mean.cu
…
mean.cuh
…
mma.cuh
…
mmq.cu
…
mmq.cuh
…
mmv.cu
…
mmv.cuh
…
mmvq.cu
…
mmvq.cuh
…
norm.cu
…
norm.cuh
…
opt-step-adamw.cu
…
opt-step-adamw.cuh
…
out-prod.cu
…
out-prod.cuh
…
pad.cu
…
pad.cuh
…
pool2d.cu
…
pool2d.cuh
…
quantize.cu
…
quantize.cuh
…
rope.cu
…
rope.cuh
…
scale.cu
…
scale.cuh
…
softmax.cu
…
softmax.cuh
…
ssm-conv.cu
…
ssm-conv.cuh
…
ssm-scan.cu
…
ssm-scan.cuh
…
sum.cu
…
sum.cuh
…
sumrows.cu
…
sumrows.cuh
…
tsembd.cu
…
tsembd.cuh
…
unary.cu
…
unary.cuh
…
upscale.cu
…
upscale.cuh
…
vecdotq.cuh
…
wkv.cu
…
wkv.cuh
…