tests : update for LLAMA_SET_ROWS=1 (#14961)

* test-thread-safety : each context uses a single sequence * embedding : handle --parallel argument ggml-ci * save-load : handle -np 1 ggml-ci * thread-safety : avoid overriding threads, reduce test case arg ggml-ci
2025-08-14 20:29:41 -04:00 · 2025-07-30 15:12:02 +03:00
parent 1e15bfd42c
commit 00131d6eaf
5 changed files with 19 additions and 2 deletions
--- a/tests/test-thread-safety.cpp
+++ b/tests/test-thread-safety.cpp
@@ -34,6 +34,9 @@ int main(int argc, char ** argv) {

    auto cparams = common_context_params_to_llama(params);

+    // each context has a single sequence
+    cparams.n_seq_max = 1;
+
    int dev_count = ggml_backend_dev_count();
    int gpu_dev_count = 0;
    for (int i = 0; i < dev_count; ++i) {