server : throw an error when slot unavailable (#4741)

2025-08-18 05:56:00 -04:00 · 2024-01-03 03:43:19 -05:00
parent f3f62f0d83
commit f2eb19bd8b
1 changed files with 9 additions and 0 deletions
--- a/examples/server/public/completion.js
+++ b/examples/server/public/completion.js
@@ -95,6 +95,15 @@ export async function* llama(prompt, params = {}, config = {}) {
              break;
            }
          }
          if (result.error) {
            result.error = JSON.parse(result.error);
            if (result.error.content.includes('slot unavailable')) {
              // Throw an error to be caught by upstream callers
              throw new Error('slot unavailable');
            } else {
              console.error(`llama.cpp error: ${result.error.content}`);
            }
          }
          if (result.error) {
            result.error = JSON.parse(result.error);
            console.error(`llama.cpp error: ${result.error.content}`);