server : send token probs for "stream == false" (#4714)

2025-06-27 12:05:03 +00:00 · 2024-01-04 19:56:33 +02:00
parent a91928014f
commit 012cf349ae
1 changed files with 2 additions and 2 deletions
--- a/examples/server/server.cpp
+++ b/examples/server/server.cpp
@ -1325,7 +1325,7 @@ struct llama_server_context
            {
                probs = std::vector<completion_token_output>(
                                    slot.generated_token_probs.begin(),
-                                    slot.generated_token_probs.begin() + slot.sent_token_probs_index);
+                                    slot.generated_token_probs.end());
            }
            res.result_json["completion_probabilities"] = probs_vector_to_json(ctx, probs);
        }