Initial upload

2025-11-11 11:47:15 +01:00
commit 7c24dab288
48 changed files with 2761 additions and 0 deletions
--- a/recipes/ai/ollama-router/README.md
+++ b/recipes/ai/ollama-router/README.md
@@ -0,0 +1,14 @@
+# Ollama Router (new schema)
+
+Dieses Paket folgt dem Beispiel-Schema (beispiel.zip). Es enthält:
+- `recipes/services/ollama-router/install.sh` – interaktive IP/Port-Abfrage (ohne ENV)
+- `recipes/services/ollama-router/docker-compose.yml` – nutzt externes Netzwerk `ai`
+- `recipes/services/ollama-router/config.yml` – wird vom Install-Skript erzeugt
+
+## Install
+```bash
+bash recipes/services/ollama-router/install.sh
+cd /srv/docker/services/ollama-router
+docker compose up -d
+```
+CPU-Fallback-Modelle werden automatisch auf dem CPU-Node gepullt, damit **Strategie-/Denker-/Gedächtnis-Agenten** immer laufen.
--- a/recipes/ai/ollama-router/install.sh
+++ b/recipes/ai/ollama-router/install.sh
@@ -0,0 +1,102 @@
+#!/usr/bin/env bash
+set -euo pipefail
+ensure_root
+detect_pkg_manager
+pkg_install curl
+install_docker
+
+if ask_to_install "Ollama Router"; then
+  echo ""
+  read -rp "Listen-Port des Router (Default 11437): " ROUTER_PORT
+  ROUTER_PORT=${ROUTER_PORT:-11437}
+  echo ""
+  read -rp "NVIDIA Node IP: " NVIDIA_IP
+  read -rp "NVIDIA Node Port (Default 11436): " NVIDIA_PORT
+  NVIDIA_PORT=${NVIDIA_PORT:-11436}
+  echo ""
+  read -rp "AMD (ROCm) Node IP: " AMD_IP
+  read -rp "AMD Node Port (Default 11435): " AMD_PORT
+  AMD_PORT=${AMD_PORT:-11435}
+  echo ""
+  read -rp "CPU-only Node IP: " CPU_IP
+  read -rp "CPU Node Port (Default 11434): " CPU_PORT
+  CPU_PORT=${CPU_PORT:-11434}
+  BASE="/srv/docker/services/ollama-router"
+  $SUDO mkdir -p "${BASE}"
+  cd "${BASE}"
+  $SUDO tee config.yml >/dev/null <<'EOF'
+routes:
+  llama3.1:8b-instruct:
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${AMD_IP}:${AMD_PORT}
+    - url: http://${CPU_IP}:${CPU_PORT}
+  mistral-nemo:12b:
+    - url: http://${AMD_IP}:${AMD_PORT}
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${CPU_IP}:${CPU_PORT}
+  huihui_ai/deepseek-r1-abliterated:14b:
+    - url: http://${AMD_IP}:${AMD_PORT}
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${CPU_IP}:${CPU_PORT}
+  phi3:medium-128k:
+    - url: http://${AMD_IP}:${AMD_PORT}
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${CPU_IP}:${CPU_PORT}
+  mxbai-embed-large:
+    - url: http://${CPU_IP}:${CPU_PORT}
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${AMD_IP}:${AMD_PORT}
+  phi3:mini:
+    - url: http://${CPU_IP}:${CPU_PORT}
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${AMD_IP}:${AMD_PORT}
+  gemma2:2b-instruct-q6_K:
+    - url: http://${CPU_IP}:${CPU_PORT}
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${AMD_IP}:${AMD_PORT}
+  qwen2.5-coder:14b:
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${AMD_IP}:${AMD_PORT}
+    - url: http://${CPU_IP}:${CPU_PORT}
+  deepseek-coder-v2:16b:
+    - url: http://${AMD_IP}:${AMD_PORT}
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${CPU_IP}:${CPU_PORT}
+  qwen2.5-coder:7b:
+    - url: http://${CPU_IP}:${CPU_PORT}
+    - url: http://${NVIDIA_IP}:${NVIDIA_PORT}
+    - url: http://${AMD_IP}:${AMD_PORT}
+EOF
+  $SUDO sed -i "s|\${NVIDIA_IP}|${NVIDIA_IP}|g; s|\${NVIDIA_PORT}|${NVIDIA_PORT}|g; s|\${AMD_IP}|${AMD_IP}|g; s|\${AMD_PORT}|${AMD_PORT}|g; s|\${CPU_IP}|${CPU_IP}|g; s|\${CPU_PORT}|${CPU_PORT}|g" config.yml
+  $SUDO tee docker-compose.yml >/dev/null <<EOF
+version: "3.9"
+services:
+  ollama-router:
+    image: ghcr.io/ollama/ollama-router:latest
+    container_name: ollama-router
+    restart: unless-stopped
+    networks: [ai]
+    volumes:
+      - ./config.yml:/app/config.yml:ro
+    ports:
+      - "${ROUTER_PORT}:11437"
+networks:
+  ai:
+    external: true
+EOF
+  $SUDO docker network inspect ai >/dev/null 2>&1 || $SUDO docker network create ai
+  CPU_MODELS=(
+    "phi3:mini"
+    "gemma2:2b-instruct-q6_K"
+    "mxbai-embed-large"
+    "qwen2.5-coder:7b"
+  )
+  for m in "${CPU_MODELS[@]}"; do
+    echo "→ Pull ${m} on CPU node ${CPU_IP}:${CPU_PORT}"
+    $SUDO curl -fsSL -X POST "http://${CPU_IP}:${CPU_PORT}/api/pull" -d "{"name":"${m}"}" || true
+  done
+  log "✅ Router konfiguriert in ${BASE}"
+  log "ℹ️  Start:  cd ${BASE} && docker compose up -d"
+else
+  log "${YELLOW}⏭ Ollama Router übersprungen.${NC}"
+fi