mirror of
https://github.com/ggml-org/llama.cpp.git
synced 2025-08-18 05:56:00 -04:00
server : throw an error when slot unavailable
(#4741)
This commit is contained in:
@@ -95,6 +95,15 @@ export async function* llama(prompt, params = {}, config = {}) {
|
|||||||
break;
|
break;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
if (result.error) {
|
||||||
|
result.error = JSON.parse(result.error);
|
||||||
|
if (result.error.content.includes('slot unavailable')) {
|
||||||
|
// Throw an error to be caught by upstream callers
|
||||||
|
throw new Error('slot unavailable');
|
||||||
|
} else {
|
||||||
|
console.error(`llama.cpp error: ${result.error.content}`);
|
||||||
|
}
|
||||||
|
}
|
||||||
if (result.error) {
|
if (result.error) {
|
||||||
result.error = JSON.parse(result.error);
|
result.error = JSON.parse(result.error);
|
||||||
console.error(`llama.cpp error: ${result.error.content}`);
|
console.error(`llama.cpp error: ${result.error.content}`);
|
||||||
|
Reference in New Issue
Block a user