Was ist ein RAG-System?
Retrieval-Augmented Generation (RAG) ist eine Technik, die große Sprachmodelle (LLMs) mit externen Wissensquellen kombiniert. Statt sich nur auf das im Modell gespeicherte Wissen zu verlassen, ruft ein RAG-System relevante Informationen aus einer Datenbank ab und nutzt sie, um präzisere und aktuellere Antworten zu generieren.
Dadurch werden klassische Probleme von LLMs wie Halluzinationen oder veraltetes Wissen deutlich reduziert.
Funktionsweise
Indexierung
Dokumente werden in kleine Abschnitte zerlegt und als Vektoren (Embeddings) in einer Vektordatenbank gespeichert.
Abruf (Retrieval)
Bei einer Nutzeranfrage werden die semantisch ähnlichsten Dokumentenabschnitte gefunden.
Augmentierung
Die gefundenen Inhalte werden zusammen mit der Frage als Kontext an das Sprachmodell übergeben.
Generierung
Das LLM erzeugt eine fundierte Antwort, die auf den abgerufenen Quellen basiert.
Vorteile von RAG
- Aktualität: Wissensbasis kann jederzeit aktualisiert werden, ohne das Modell neu zu trainieren.
- Genauigkeit: Antworten basieren auf verifizierbaren Quellen.
- Transparenz: Quellen können zusammen mit der Antwort angezeigt werden.
- Kosteneffizienz: Günstiger als ein vollständiges Fine-Tuning.
- Datenschutz: Sensible Daten bleiben in der eigenen Infrastruktur.
Typische Anwendungsfälle
Unternehmenswissen
Interne Chatbots, die auf Handbücher, Richtlinien und Wikis zugreifen.
Kundensupport
Automatisierte Antworten basierend auf Produktdokumentation und FAQs.
Forschung
Schnelle Recherche in wissenschaftlichen Publikationen und Studien.
Recht & Compliance
Analyse von Verträgen, Gesetzen und Vorschriften mit nachvollziehbaren Quellen.