Adding logprobs to /v1/completions (#11344)

Signed-off-by: Jiri Podivin <jpodivin@redhat.com>
2025-07-28 03:55:06 -04:00 · 2025-01-22 12:51:32 +01:00
parent a94f3b2727
commit 96f4053934
1 changed files with 5 additions and 0 deletions
--- a/examples/server/server.cpp
+++ b/examples/server/server.cpp
@ -267,6 +267,11 @@ struct server_task {
        params.speculative.n_min = std::max(params.speculative.n_min, 2);
        params.speculative.n_max = std::max(params.speculative.n_max, 0);
        // Use OpenAI API logprobs only if n_probs wasn't provided
        if (data.contains("logprobs") && params.sampling.n_probs == defaults.sampling.n_probs){
            params.sampling.n_probs = json_value(data, "logprobs", defaults.sampling.n_probs);
        }
        if (data.contains("lora")) {
            if (data.at("lora").is_array()) {
                params.lora = parse_lora_request(params_base.lora_adapters, data.at("lora"));