server : add some missing env variables (#9116)

* server : add some missing env variables * add LLAMA_ARG_HOST to server dockerfile * also add LLAMA_ARG_CONT_BATCHING
2025-06-26 19:55:04 +00:00 · 2024-08-27 11:07:01 +02:00
parent 2e59d61c1b
commit a77feb5d71
7 changed files with 60 additions and 17 deletions
--- a/.devops/llama-server-cuda.Dockerfile
+++ b/.devops/llama-server-cuda.Dockerfile
@ -24,6 +24,8 @@ ENV CUDA_DOCKER_ARCH=${CUDA_DOCKER_ARCH}
 ENV GGML_CUDA=1
 # Enable cURL
 ENV LLAMA_CURL=1
+# Must be set to 0.0.0.0 so it can listen to requests from host machine
+ENV LLAMA_ARG_HOST=0.0.0.0

 RUN make -j$(nproc) llama-server