llama : update llama_kv_self API

ggml-ci
2025-08-14 20:29:41 -04:00 · 2025-01-14 16:47:34 +02:00
parent fd05ab87aa
commit 17b363afd3
30 changed files with 387 additions and 205 deletions
--- a/examples/llama-bench/llama-bench.cpp
+++ b/examples/llama-bench/llama-bench.cpp
@@ -1575,11 +1575,9 @@ int main(int argc, char ** argv) {
            return 1;
        }

-        llama_kv_cache * kv = llama_get_kv_cache(ctx);
-
        test t(inst, lmodel, ctx);

-        llama_kv_cache_clear(kv);
+        llama_kv_self_clear(ctx);

        // cool off before the test
        if (params.delay) {
@@ -1619,7 +1617,7 @@ int main(int argc, char ** argv) {
        }

        for (int i = 0; i < params.reps; i++) {
-            llama_kv_cache_clear(kv);
+            llama_kv_self_clear(ctx);

            uint64_t t_start = get_time_ns();