llama: Support MiniCPM-1B (with & w/o longrope) (#10559)

2025-08-13 11:57:43 -04:00 · 2024-12-04 17:42:50 +08:00
parent 2759916d86
commit 8d0cfd554a
4 changed files with 61 additions and 183 deletions
--- a/include/llama.h
+++ b/include/llama.h
@@ -185,7 +185,8 @@ extern "C" {
        LLAMA_ROPE_SCALING_TYPE_NONE        = 0,
        LLAMA_ROPE_SCALING_TYPE_LINEAR      = 1,
        LLAMA_ROPE_SCALING_TYPE_YARN        = 2,
-        LLAMA_ROPE_SCALING_TYPE_MAX_VALUE   = LLAMA_ROPE_SCALING_TYPE_YARN,
+        LLAMA_ROPE_SCALING_TYPE_LONGROPE    = 3,
+        LLAMA_ROPE_SCALING_TYPE_MAX_VALUE   = LLAMA_ROPE_SCALING_TYPE_LONGROPE,
    };

    enum llama_pooling_type {