Add Docker Model Runner backend

2025-06-26 18:26:48 +00:00 · 2025-06-15 17:51:09 +02:00 · 2025-06-15 17:51:09 +02:00 · dd3381884d
commit dd3381884d
parent 63256136ef
6 changed files with 186 additions and 5 deletions
--- a/.env.example
+++ b/.env.example
@ -5,6 +5,9 @@ OLLAMA_BASE_URL='http://localhost:11434'
 OPENAI_API_BASE_URL=''
 OPENAI_API_KEY=''

+# Docker Model Runner API base URL
+DMR_BASE_URL='http://localhost:12434'
+
 # AUTOMATIC1111_BASE_URL="http://localhost:7860"

 # For production, you should only need one host as
--- a/README.md
+++ b/README.md
@ -25,7 +25,7 @@ For more information, be sure to check out our [Open WebUI Documentation](https:

 - 🚀 **Effortless Setup**: Install seamlessly using Docker or Kubernetes (kubectl, kustomize or helm) for a hassle-free experience with support for both `:ollama` and `:cuda` tagged images.

- 🤝 **Ollama/OpenAI API Integration**: Effortlessly integrate OpenAI-compatible APIs for versatile conversations alongside Ollama models. Customize the OpenAI API URL to link with **LMStudio, GroqCloud, Mistral, OpenRouter, and more**.
+- 🤝 **Ollama/OpenAI API Integration**: Effortlessly integrate OpenAI-compatible APIs for versatile conversations alongside Ollama models. Customize the OpenAI API URL to link with **LMStudio, GroqCloud, Mistral, OpenRouter, Docker Model Runner, and more**.

 - 🛡️ **Granular Permissions and User Groups**: By allowing administrators to create detailed user roles and permissions, we ensure a secure user environment. This granularity not only enhances security but also allows for customized user experiences, fostering a sense of ownership and responsibility amongst users.

@ -165,6 +165,14 @@ This will start the Open WebUI server, which you can access at [http://localhost
  docker run -d -p 3000:8080 -e OPENAI_API_KEY=your_secret_key -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
  ```

+### Using Docker Model Runner
+
+Enable Docker Model Runner in Docker Desktop and set the `DMR_BASE_URL` environment variable to the exposed API endpoint:
+
+```bash
+docker run -d -p 3000:8080 -e DMR_BASE_URL=http://localhost:12434 -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
+```
+
 ### Installing Open WebUI with Bundled Ollama Support

 This installation method uses a single container image that bundles Open WebUI with Ollama, allowing for a streamlined setup via a single command. Choose the appropriate command based on your hardware setup:
--- a/backend/open_webui/config.py
+++ b/backend/open_webui/config.py
@ -895,6 +895,36 @@ except Exception:
    pass
 OPENAI_API_BASE_URL = "https://api.openai.com/v1"

+####################################
+# DOCKER MODEL RUNNER
+####################################
+
+ENABLE_DMR_API = PersistentConfig(
+    "ENABLE_DMR_API",
+    "dmr.enable",
+    os.environ.get("ENABLE_DMR_API", "True").lower() == "true",
+)
+
+DMR_API_KEYS = [k.strip() for k in os.environ.get("DMR_API_KEYS", "").split(";")]
+DMR_API_KEYS = PersistentConfig("DMR_API_KEYS", "dmr.api_keys", DMR_API_KEYS)
+
+DMR_BASE_URL = os.environ.get("DMR_BASE_URL", "")
+if DMR_BASE_URL:
+    DMR_BASE_URL = DMR_BASE_URL[:-1] if DMR_BASE_URL.endswith("/") else DMR_BASE_URL
+
+DMR_BASE_URLS = os.environ.get("DMR_BASE_URLS", "")
+DMR_BASE_URLS = DMR_BASE_URLS if DMR_BASE_URLS != "" else DMR_BASE_URL or "http://localhost:12434"
+DMR_BASE_URLS = [url.strip() for url in DMR_BASE_URLS.split(";")]
+DMR_BASE_URLS = PersistentConfig(
+    "DMR_BASE_URLS", "dmr.base_urls", DMR_BASE_URLS
+)
+
+DMR_API_CONFIGS = PersistentConfig(
+    "DMR_API_CONFIGS",
+    "dmr.api_configs",
+    {},
+)
+
 ####################################
 # TOOL_SERVERS
 ####################################
--- a/backend/open_webui/main.py
+++ b/backend/open_webui/main.py
@ -63,6 +63,7 @@ from open_webui.routers import (
    images,
    ollama,
    openai,
+    docker_model_runner,
    retrieval,
    pipelines,
    tasks,
@ -112,6 +113,11 @@ from open_webui.config import (
    OPENAI_API_BASE_URLS,
    OPENAI_API_KEYS,
    OPENAI_API_CONFIGS,
+    # Docker Model Runner
+    ENABLE_DMR_API,
+    DMR_BASE_URLS,
+    DMR_API_KEYS,
+    DMR_API_CONFIGS,
    # Direct Connections
    ENABLE_DIRECT_CONNECTIONS,
    # Thread pool size for FastAPI/AnyIO
@ -589,6 +595,19 @@ app.state.config.OPENAI_API_CONFIGS = OPENAI_API_CONFIGS

 app.state.OPENAI_MODELS = {}

+########################################
+#
+# DOCKER MODEL RUNNER
+#
+########################################
+
+app.state.config.ENABLE_DMR_API = ENABLE_DMR_API
+app.state.config.DMR_BASE_URLS = DMR_BASE_URLS
+app.state.config.DMR_API_KEYS = DMR_API_KEYS
+app.state.config.DMR_API_CONFIGS = DMR_API_CONFIGS
+
+app.state.DMR_MODELS = {}
+
 ########################################
 #
 # TOOL SERVERS
@ -1111,6 +1130,7 @@ app.mount("/ws", socket_app)

 app.include_router(ollama.router, prefix="/ollama", tags=["ollama"])
 app.include_router(openai.router, prefix="/openai", tags=["openai"])
+app.include_router(docker_model_runner.router, prefix="/dmr", tags=["dmr"])


 app.include_router(pipelines.router, prefix="/api/v1/pipelines", tags=["pipelines"])
--- a/backend/open_webui/routers/docker_model_runner.py
+++ b/backend/open_webui/routers/docker_model_runner.py
@ -0,0 +1,110 @@
+from contextlib import contextmanager
+from typing import Optional
+
+from fastapi import APIRouter, Depends, Request
+from pydantic import BaseModel
+
+from open_webui.models.users import UserModel
+from open_webui.routers import openai
+from open_webui.routers.openai import ConnectionVerificationForm
+from open_webui.utils.auth import get_admin_user, get_verified_user
+
+router = APIRouter()
+
+@contextmanager
+def _dmr_context(request: Request):
+    orig_urls = request.app.state.config.OPENAI_API_BASE_URLS
+    orig_keys = request.app.state.config.OPENAI_API_KEYS
+    orig_configs = request.app.state.config.OPENAI_API_CONFIGS
+    orig_models = request.app.state.OPENAI_MODELS
+    request.app.state.config.OPENAI_API_BASE_URLS = request.app.state.config.DMR_BASE_URLS
+    request.app.state.config.OPENAI_API_KEYS = request.app.state.config.DMR_API_KEYS
+    request.app.state.config.OPENAI_API_CONFIGS = request.app.state.config.DMR_API_CONFIGS
+    request.app.state.OPENAI_MODELS = request.app.state.DMR_MODELS
+    try:
+        yield
+    finally:
+        request.app.state.config.OPENAI_API_BASE_URLS = orig_urls
+        request.app.state.config.OPENAI_API_KEYS = orig_keys
+        request.app.state.config.OPENAI_API_CONFIGS = orig_configs
+        request.app.state.OPENAI_MODELS = orig_models
+
+
+@router.get("/config")
+async def get_config(request: Request, user=Depends(get_admin_user)):
+    return {
+        "ENABLE_DMR_API": request.app.state.config.ENABLE_DMR_API,
+        "DMR_BASE_URLS": request.app.state.config.DMR_BASE_URLS,
+        "DMR_API_KEYS": request.app.state.config.DMR_API_KEYS,
+        "DMR_API_CONFIGS": request.app.state.config.DMR_API_CONFIGS,
+    }
+
+
+class DMRConfigForm(BaseModel):
+    ENABLE_DMR_API: Optional[bool] = None
+    DMR_BASE_URLS: list[str]
+    DMR_API_KEYS: list[str] = []
+    DMR_API_CONFIGS: dict = {}
+
+
+@router.post("/config/update")
+async def update_config(request: Request, form_data: DMRConfigForm, user=Depends(get_admin_user)):
+    request.app.state.config.ENABLE_DMR_API = form_data.ENABLE_DMR_API
+    request.app.state.config.DMR_BASE_URLS = form_data.DMR_BASE_URLS
+    request.app.state.config.DMR_API_KEYS = form_data.DMR_API_KEYS
+    request.app.state.config.DMR_API_CONFIGS = form_data.DMR_API_CONFIGS
+
+    if len(request.app.state.config.DMR_API_KEYS) != len(request.app.state.config.DMR_BASE_URLS):
+        if len(request.app.state.config.DMR_API_KEYS) > len(request.app.state.config.DMR_BASE_URLS):
+            request.app.state.config.DMR_API_KEYS = request.app.state.config.DMR_API_KEYS[: len(request.app.state.config.DMR_BASE_URLS)]
+        else:
+            request.app.state.config.DMR_API_KEYS += [""] * (
+                len(request.app.state.config.DMR_BASE_URLS) - len(request.app.state.config.DMR_API_KEYS)
+            )
+
+    keys = list(map(str, range(len(request.app.state.config.DMR_BASE_URLS))))
+    request.app.state.config.DMR_API_CONFIGS = {
+        k: v for k, v in request.app.state.config.DMR_API_CONFIGS.items() if k in keys
+    }
+
+    return {
+        "ENABLE_DMR_API": request.app.state.config.ENABLE_DMR_API,
+        "DMR_BASE_URLS": request.app.state.config.DMR_BASE_URLS,
+        "DMR_API_KEYS": request.app.state.config.DMR_API_KEYS,
+        "DMR_API_CONFIGS": request.app.state.config.DMR_API_CONFIGS,
+    }
+
+
+@router.post("/verify")
+async def verify_connection(form_data: ConnectionVerificationForm, user=Depends(get_admin_user)):
+    return await openai.verify_connection(form_data, user)
+
+
+@router.get("/models")
+@router.get("/models/{url_idx}")
+async def get_models(request: Request, url_idx: Optional[int] = None, user=Depends(get_verified_user)):
+    with _dmr_context(request):
+        return await openai.get_models(request, url_idx=url_idx, user=user)
+
+
+@router.post("/chat/completions")
+async def generate_chat_completion(request: Request, form_data: dict, user=Depends(get_verified_user)):
+    with _dmr_context(request):
+        return await openai.generate_chat_completion(request, form_data, user=user)
+
+
+@router.post("/completions")
+async def completions(request: Request, form_data: dict, user=Depends(get_verified_user)):
+    with _dmr_context(request):
+        return await openai.completions(request, form_data, user=user)
+
+
+@router.post("/embeddings")
+async def embeddings(request: Request, form_data: dict, user=Depends(get_verified_user)):
+    with _dmr_context(request):
+        return await openai.embeddings(request, form_data, user=user)
+
+
+async def get_all_models(request: Request, user: UserModel = None):
+    with _dmr_context(request):
+        return await openai.get_all_models.__wrapped__(request, user)
--- a/backend/open_webui/utils/models.py
+++ b/backend/open_webui/utils/models.py
@ -6,7 +6,7 @@ import sys
 from aiocache import cached
 from fastapi import Request

-from open_webui.routers import openai, ollama
+from open_webui.routers import openai, ollama, docker_model_runner
 from open_webui.functions import get_function_models


@ -56,6 +56,11 @@ async def fetch_openai_models(request: Request, user: UserModel = None):
    return openai_response["data"]


+async def fetch_docker_models(request: Request, user: UserModel = None):
+    dmr_response = await docker_model_runner.get_all_models(request, user=user)
+    return dmr_response["data"]
+
+
 async def get_all_base_models(request: Request, user: UserModel = None):
    openai_task = (
        fetch_openai_models(request, user)
@ -67,13 +72,18 @@ async def get_all_base_models(request: Request, user: UserModel = None):
        if request.app.state.config.ENABLE_OLLAMA_API
        else asyncio.sleep(0, result=[])
    )
+    dmr_task = (
+        fetch_docker_models(request, user)
+        if request.app.state.config.ENABLE_DMR_API
+        else asyncio.sleep(0, result=[])
+    )
    function_task = get_function_models(request)

-    openai_models, ollama_models, function_models = await asyncio.gather(
-        openai_task, ollama_task, function_task
+    openai_models, ollama_models, function_models, dmr_models = await asyncio.gather(
+        openai_task, ollama_task, function_task, dmr_task
    )

-    return function_models + openai_models + ollama_models
+    return function_models + openai_models + ollama_models + dmr_models


 async def get_all_models(request, user: UserModel = None):