llama : refactor kv cache guard (#12695)

* llama : refactor kv cache guard ggml-ci * cont : fix comment [no ci] * llama : fix kv_cache restore logic ggml-ci * context : simplify kv cache updates ggml-ci * cont : better name [no ci] * llama : fix llama_decode return code when could not find KV slot ggml-ci * context : change log err -> warn [no ci] * kv-cache : add comment + warning
2025-06-27 12:05:03 +00:00 · 2025-04-02 14:32:59 +03:00
parent 83a88bd6af
commit a10b36c91a
4 changed files with 107 additions and 127 deletions
--- a/examples/parallel/parallel.cpp
+++ b/examples/parallel/parallel.cpp
@ -106,6 +106,8 @@ int main(int argc, char ** argv) {

    common_params params;

+    params.n_predict = 128;
+
    if (!common_params_parse(argc, argv, params, LLAMA_EXAMPLE_PARALLEL)) {
        return 1;
    }