llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-08-16 21:22:37 -04:00

Files

Georgi Gerganov 1bde94dd02 server : remove self-extend features (#9860 )

* server : remove self-extend

ggml-ci

* server : fix context limit check to use slot.n_past

ggml-ci

2024-10-12 16:06:31 +03:00

2024-10-08 13:27:04 +02:00

ctx_shift.feature

2024-10-12 16:06:31 +03:00

embeddings.feature

2024-09-28 17:42:03 +03:00

environment.py

2024-03-20 06:33:49 +01:00

issues.feature

2024-03-02 22:00:14 +01:00

lora.feature

2024-08-06 17:33:39 +02:00

parallel.feature

2024-09-06 23:21:29 +02:00

passkey.feature

2024-09-06 23:21:29 +02:00

rerank.feature

2024-09-28 17:42:03 +03:00

results.feature

2024-05-20 22:10:03 +10:00

security.feature

2024-10-08 13:27:04 +02:00

server.feature

2024-09-12 22:30:11 +02:00

slotsave.feature

2024-05-21 14:39:48 +02:00

wrong_usages.feature

2024-09-02 17:11:51 +02:00