llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-08-04 16:23:49 -04:00

Files

Georgi Gerganov 1bde94dd02 server : remove self-extend features (#9860 )

* server : remove self-extend

ggml-ci

* server : fix context limit check to use slot.n_past

ggml-ci

2024-10-12 16:06:31 +03:00

2024-10-08 13:27:04 +02:00

ctx_shift.feature

2024-10-12 16:06:31 +03:00

embeddings.feature

2024-09-28 17:42:03 +03:00

environment.py

…

issues.feature

…

lora.feature

2024-08-06 17:33:39 +02:00

parallel.feature

2024-09-06 23:21:29 +02:00

passkey.feature

2024-09-06 23:21:29 +02:00

rerank.feature

2024-09-28 17:42:03 +03:00

results.feature

2024-05-20 22:10:03 +10:00

security.feature

2024-10-08 13:27:04 +02:00

server.feature

2024-09-12 22:30:11 +02:00

slotsave.feature

2024-05-21 14:39:48 +02:00

wrong_usages.feature

2024-09-02 17:11:51 +02:00