llama : cont

ggml-ci
2025-08-14 12:19:48 -04:00 · 2025-01-13 14:56:52 +02:00
parent f78b396ee7
commit e4550fbafc
19 changed files with 128 additions and 79 deletions
--- a/examples/llama-bench/llama-bench.cpp
+++ b/examples/llama-bench/llama-bench.cpp
@@ -1575,9 +1575,11 @@ int main(int argc, char ** argv) {
            return 1;
        }

+        llama_kv_cache * kv = llama_get_kv_cache(ctx);
+
        test t(inst, lmodel, ctx);

-        llama_kv_cache_clear(ctx);
+        llama_kv_cache_clear(kv);

        // cool off before the test
        if (params.delay) {
@@ -1617,7 +1619,7 @@ int main(int argc, char ** argv) {
        }

        for (int i = 0; i < params.reps; i++) {
-            llama_kv_cache_clear(ctx);
+            llama_kv_cache_clear(kv);

            uint64_t t_start = get_time_ns();