Ollama + WebUI – Installation

Ollama est un outil backend open-source qui permet d'exécuter des modèles de langage (LLM) localement tandis qu'Open WebUI est une interface graphique web intuitive qui sert de front-end pour interagir avec ces modèles. Cette combinaison permet de créer une solution d'IA auto-hébergée, privée et performante, offrant une expérience comparable à ChatGPT sans dépendre de services cloud.

Une fois configurés, les utilisateurs peuvent gérer plusieurs modèles (comme Llama 3, Mistral ou Gemma). La première connexion à Open WebUI crée automatiquement un compte administrateur qui permet de gérer les utilisateurs et les paramètres système.

Ollama

1. Proxy Inversé

Configurer le Proxy Inversé en liant un NDD, Sous domaine ou Wildcard dédié. Le port local est déterminé pour cet article à 3210 en http avec l'IP locale de la machine hôte et, validez le Websockets Support ainsi que Force SSL + HSTS Enabled + HTTP/2 Support.

2. Configuration Console

2.1. Application personnalisée

Cliquez sur l’icône + en haut à droite de la page d’accueil au dessus des tuiles et sélectionnez Installer une application personnalisée.

2.2. Importer

La fenêtre des paramètres de votre application s’ouvre et cliquez sur l’icône flèche vers le carré en haut à droite, avec pour libellé Importer

2.3. Importer le YAML

Le pop-up vous propose d’importer votre configuration avec un fichier YAML ou de copier-coller celle-ci dans la fenêtre dédiée. Vous pouvez agrandir cette fenêtre en sélectionnant les deux traits en bas à droite.

Copier-coller dans la fenêtre le code de configuration ci dessous (ouvrir la bascule)

YAML

Ollama + WebUI

name: ollama
services:
  ollama:
    cpu_shares: 
    command: []
    container_name: ollama
    deploy:
      resources:
        limits:
          memory: 
        reservations:
          devices: []
    environment:
      - OLLAMA_HOSTNAME=
    image: ollama/ollama:latest
    labels:
      icon: https://cdn.jsdelivr.net/gh/IceWhaleTech/CasaOS-AppStore@main/Apps/Ollama/icon.png
    ports:
      - target: 11434
        published: "11434"
        protocol: tcp
    restart: unless-stopped
    volumes:
      - type: bind
        source: /DATA/AppData/ollama/data
        target: /root/.ollama
    devices: []
    cap_add: []
    networks:
      - ollama
    privileged: false
  open-webui:
    cpu_shares: 
    command: []
    container_name: open-webui
    depends_on:
      ollama:
        condition: service_started
        required: true
    deploy:
      resources:
        limits:
          memory: 
        reservations:
          devices: []
    environment:
      - OLLAMA_BASE_URL=http://ollama:11434
    image: ghcr.io/open-webui/open-webui:main
    labels:
      icon: https://cdn.jsdelivr.net/gh/IceWhaleTech/CasaOS-AppStore@main/Apps/Ollama/icon.png
    ports:
      - target: 8080
        published: "3210"
        protocol: tcp
    restart: unless-stopped
    volumes:
      - type: bind
        source: /DATA/AppData/ollama/webui
        target: /app/backend/data
    devices: []
    cap_add: []
    networks:
      - ollama
    privileged: false
networks:
  ollama:
    name: ollama
    driver: bridge
x-casaos:
  author: self
  category: self
  hostname: 
  icon: https://cdn.jsdelivr.net/gh/IceWhaleTech/CasaOS-AppStore@main/Apps/Ollama/icon.png
  index: /
  is_uncontrolled: false
  port_map: "443"
  scheme: https
  store_app_id: ollama
  title:
    custom: OLLAMA

Cliquez sur Appliquer, puis sur OK sur le Pop-up qui s’affiche

2.4. Paramètres Ollama + WebUI

ONGLET OLLAMA

Web UI : https > ollama.ndd.fr > 443

Variables d'environnement :

OLLAMA_HOSTNAME = le ndd (sans https://)

Périphériques (optionnel) :

Si iGPU Intel : /dev/dri=/dev/dri

Si GPU AMD (iGPUs ou cartes dédiées) : /dev/kfd=/dev/kfd (et sur 2ème ligne) /dev/dri=/dev/dri

ONGLET WEBUI

Optionnel : Vous pouvez changer le port Hôte si besoin

2.5. Installer

Cliquez sur Installer et patientez le temps de l’installation.

NB Si vous avez installé le Pare-feu ouvrez les ports d'écoute à l'onglet Rules

Puis, cliquez sur la nouvelle tuile créée pour ouvrir une nouvelle page web

3. Interface Web

3.1. Créer un compte administrateur

En bas de la pemière page d'accueil, cliquez (en bas) sur Démarrer.

Remplissez les trois fenêtres et, Créer un compte administrateur

3.2. Le modèle

Il nous faut maintenant télécharger un modèle.

En juin 2026, le choix du meilleur modèle Ollama dépend de vos ressources matérielles et de l'usage prévu, la bibliothèque dépassant désormais 4 500 modèles.

Pour cette démo, je télécharge Mistral, conseillé pour un usage généraliste et français.

Indiquez le modèle souhaité, sur la petite fenêtre, en haut à gauche. Et, cliquez sur "Récupérer Mistral sur Ollama.com".

Le téléchargement du modèle choisit démarre.

3.3. Les Prompts

Le terme prompt désigne l'instruction ou la question formulée par l'utilisateur pour guider l'IA dans la génération d'une réponse.

Inscrivez votre prompt sur la fenêtre de recherche principale et cliquez sur l'icône flêche.

NB : La génération de la réponse consomme une ressouce CPU importante ...

morgyann

Curieux de nature, j’ai découvert le monde des serveurs et plus particulièrement les applications Docker en apprenant au fil des essais et des ressources partagées sur le web. En retour, je partage ce que je connais et plus particulièrement à l'intention des débutants.

Vous pouvez me retrouver sur Forum des NAS sur lequel je participe régulièrement.

Soutenons l'utilisation des applications open source et leurs développeurs.

← Article précédentArticle suivant →