KI mit eigenen Systemen verbinden – RAG, MCP & Automatisierung

RAG SYSTEM

LLMs an Wissensdatenbanken, Ticketsysteme und Inventardaten anbinden – per RAG. Über MCP und n8n stößt die KI sogar echte Aktionen an. So wird aus einem generischen Chat ein Assistent, der dein Firmenwissen kennt und mitarbeitet.

Antworten mit Beleg

Die KI antwortet auf Basis deiner echten Dokumente statt aus dem Bauch – das reduziert Halluzinationen deutlich.

Immer aktuell

Neue Inhalte sind sofort verfügbar – ohne das Modell neu zu trainieren. Wissen ändern heißt: Quelle aktualisieren.

Quellen nachvollziehbar

Antworten verweisen auf die Fundstelle – nachprüfbar statt Blackbox, gerade bei kritischen Entscheidungen.

Daten unter Kontrolle

Die Wissensquellen bleiben im Haus oder in der EU – ans Modell geht nur der relevante Ausschnitt.

Vom Chat zur Aktion

Über MCP und n8n stößt die KI echte Vorgänge an – ein Ticket anlegen, Daten abfragen, einen Ablauf starten.

Modell-unabhängig

Funktioniert mit Open-Weight- wie Frontier-Modellen, selbst gehostet oder über NWS – kein Lock-in.

Das Problem

Eine KI von der Stange kennt dein Unternehmen nicht – und das merkt man an den Antworten. Genau hier setzt RAG an.

Generische KI kennt dich nicht

Ein Standard-LLM weiß nichts über deine Produkte, Verträge und Prozesse. Die Antworten bleiben allgemein und oft unbrauchbar.

Halluzinationen

Ohne Faktenbasis erfindet die KI plausibel klingende, aber falsche Antworten – ein Risiko für jede Entscheidung.

Wissen ist verstreut

Wiki, Tickets, Dateiablagen, Inventar: Schon Menschen finden die richtige Info kaum – eine KI ohne Anbindung erst recht nicht.

So arbeiten wir mit dir

Vier Schritte, identisch zu jeder NETWAYS-Lösung – von der Auswahl der Quellen bis zum handelnden Assistenten im laufenden Betrieb.

Schritt 1

Analyse & Konzept

Wir klären die Anwendungsfälle, sichten deine Wissensquellen und Systeme und legen fest, worauf die KI zugreifen soll – und worauf nicht.

→ Klare Grenzen für Zugriff und Berechtigungen von Anfang an.

"

Schritt 2

Aufbau & Integration

Wir bauen die RAG-Pipeline: Quellen anbinden, indexieren (Embeddings) und Retrieval einrichten – plus MCP/n8n für Aktionen.

→ Dein Wissen wird durchsuchbar, ohne in ein Modelltraining zu fließen.

"

Schritt 3

Inbetriebnahme & Grounding

Die Lösung geht live: Die KI beantwortet Fragen mit Kontext aus deinen Quellen und nennt die Fundstelle. Aktionen laufen über MCP/n8n.

→ Belastbare Antworten mit Beleg statt geratener Aussagen.

"

Schritt 4

Support & Betrieb

Auf Wunsch übernehmen wir Betrieb, Aktualisierung der Quellen und Pflege (MyEngineer) – oder wir schulen dein Team.

→ Neue Quellen und Tools ergänzen wir, ohne dass du die Pipeline pflegst.

Wie RAG funktioniert

RAG steht für Retrieval-Augmented Generation: Die KI schlägt vor dem Antworten in deinen Quellen nach. In vier Schritten von der Frage zur belegten Antwort.

Wissensquellen anbinden

Quellen anbinden

Wissensdatenbanken, Tickets, Dokumente und Inventar werden angebunden und als Embeddings indexiert – durchsuchbar gemacht.

Effekt: dein verstreutes Wissen wird auffindbar.

Retrieval

Relevantes finden

Zu jeder Frage holt das Retrieval die passenden Ausschnitte aus deinen Quellen – statt das ganze Wissen ans Modell zu geben.

Effekt: nur der relevante Kontext erreicht das Modell.

Antwort generieren

Fundierte Antwort

Das LLM beantwortet die Frage mit diesem Kontext und nennt die Quelle – nachvollziehbar und überprüfbar.

Effekt: belastbare Antworten statt Halluzinationen.

Handeln per MCP

Aktion auslösen

Über MCP-Tools oder n8n stößt die KI bei Bedarf echte Vorgänge an – ein Ticket anlegen, Daten abfragen, einen Ablauf starten.

Effekt: aus Antworten werden Handlungen.

Was Du erreichst

Antworten auf Firmenwissen, weniger Halluzinationen – ein Assistent, der handelt.

Antworten auf Firmenwissen

Die KI kennt deine Dokumente, Tickets und Daten und antwortet konkret auf deinen Kontext – nicht allgemein.

Weniger Halluzinationen

Grounding auf echten Quellen mit Belegstellen macht Antworten überprüfbar und vertrauenswürdig.

Ein handelnder Assistent

Über MCP und n8n bleibt es nicht bei Auskünften – die KI stößt echte Vorgänge in deinen Systemen an.

Womit wird deine Lösung gebaut

Bewährte Open-Source-Komponenten – im eigenen Haus oder über NWS betrieben. Du entscheidest, was du selbst machst und was NETWAYS übernimmt.

vLLM

Das Inference-Backend für das Sprachmodell – performant und OpenAI-kompatibel, selbst gehostet oder als Managed AI Model über NWS.

OpenWebUI

Die vertraute Chat-Oberfläche mit nativer RAG- und Tool-Integration – hier stellen deine Mitarbeitenden ihre Fragen ans Firmenwissen.

n8n

Orchestriert die RAG-Pipeline und die Aktionen: bindet Quellen an, ruft das Retrieval auf und stößt über MCP echte Vorgänge in deinen Systemen an.

Snipe-IT

Beispiel für eine angebundene Datenquelle: Inventar- und Asset-Daten, auf die die KI per RAG zugreift und gezielt antwortet.

Was du schon nutzt, binden wir an

RAG lebt von deinen Quellen. Eine Auswahl der Systeme, die wir typischerweise als Wissensbasis anbinden – und der Bausteine, die die Pipeline tragen.

Wissensquellen

Confluence
Nextcloud
SharePoint
Dateiablagen
Wikis

Daten & Inventar

Snipe-IT
PostgreSQL / MySQL
CRM-Systeme
Icinga

Ticketsysteme & ITSM

Jira
Zammad
OTRS
ServiceNow

Modell & Anbindung

vLLM
NWS AI
OpenAI-kompatible API
MCP
n8n

Vektor & Retrieval

pgvector
Qdrant
Elastic / OpenSearch
bge-Modelle

Fragen & Antworten

Die meistgestellten Fragen zu dieser Lösung

Was ist RAG?

2

3

RAG steht für Retrieval-Augmented Generation. Statt nur aus dem Trainingswissen zu antworten, durchsucht das System zuerst deine eigenen Quellen, holt die relevanten Ausschnitte und gibt sie dem Sprachmodell als Kontext mit. Die Antwort basiert dann auf deinen echten Dokumenten – inklusive Quellenangabe.

Wie verbinde ich KI mit internen Daten?

2

3

Indem die Quellen – Wiki, Tickets, Dateiablagen, Datenbanken – angebunden und als Embeddings indexiert werden. Zu jeder Frage findet das Retrieval die passenden Stellen, die das Modell zur Antwort nutzt. NETWAYS baut diese Pipeline und regelt dabei auch Zugriff und Berechtigungen.

Was ist MCP?

2

3

MCP (Model Context Protocol) ist ein offener Standard, über den ein Sprachmodell auf externe Werkzeuge und Datenquellen zugreift. Damit kann die KI nicht nur lesen, sondern definierte Aktionen ausführen – etwa ein Ticket anlegen oder eine Datenbank abfragen – über eine saubere, kontrollierbare Schnittstelle.

Kann KI auf interne Systeme zugreifen?

2

3

Ja – kontrolliert. Über MCP-Tools und n8n erhält die KI gezielt Zugriff auf einzelne Systeme und darf nur klar definierte Aktionen auslösen. Berechtigungen und Grenzen legen wir gemeinsam fest, sodass die KI nur das sieht und tut, was vorgesehen ist.

Reduziert RAG Halluzinationen?

2

3

Deutlich. Weil die Antwort auf konkreten, abgerufenen Quellen beruht und die Fundstelle nennt, erfindet das Modell weniger und wird überprüfbar. Ganz ausschließen lässt sich Unsinn nie, aber gutes Grounding plus Quellenangabe macht Antworten verlässlich genug für den Arbeitsalltag.

Brauche ich dafür ein eigenes Modell?

2

3

Nein. RAG funktioniert mit Open-Weight-Modellen ebenso wie mit Frontier-Modellen – selbst gehostet, über die Managed AI Models von NWS oder per API. Du kannst klein über NWS starten und später auf einen eigenen Betrieb wechseln, ohne die RAG-Pipeline neu zu bauen.

Jetzt persönlichen Beratungstermin mit Stefan vereinbarenIndividuelle Open-Source-Lösungen, die zu Dir und Deinem Unternehmen passen.Kontakt aufnehmen