Die Theorie steht. Jetzt wird's praktisch: Wie machen Sie Ihr reales Firmenwissen — verteilt über Confluence, SharePoint, E-Mails, PDFs und Datenbanken — für AI zugänglich?
Erstellen Sie eine Übersicht aller Wissensquellen:
| Quelle | Typ | Umfang | Aktualisierung | Priorität |
|---|---|---|---|---|
| Confluence | Wiki | ~2.000 Seiten | Wöchentlich | Hoch |
| SharePoint | Dateien | ~10.000 Docs | Monatlich | Hoch |
| E-Mail-Archive | Unstrukturiert | ~500.000 | Täglich | Mittel |
| Interne DB | Strukturiert | ~50 Tabellen | Echtzeit | Hoch |
| Slack/Teams | Chat | ~1M Nachrichten | Echtzeit | Niedrig |
Quelle → Extraktion → Bereinigung → PII-Filter → Chunking → Embedding → Vektor-DB
↓ ↓
Scheduler Metadata-Store
(täglich/wöchentlich) (Quelle, Datum, Rechte)
Kritisch: Die RAG-Pipeline darf nur Informationen zurückgeben, die der anfragende Nutzer auch sehen darf.
Praxis-Tipp: Starten Sie mit einer einzigen Quelle (z. B. Confluence) und 10 Power-Usern. Sammeln Sie Feedback, optimieren Sie, dann skalieren Sie auf weitere Quellen. Ein RAG-System lebt von iterativer Verbesserung.