Technik

DSGVO-konformer KI-Chatbot:
Was technisch erlaubt ist und was nicht

Ein KI-Chatbot, der wirklich auf Ihre Firmendaten antwortet und gleichzeitig DSGVO-konform läuft, ist 2026 technisch machbar – aber nur in bestimmten Architekturen. Welche Setups gehen, welche nicht, und worauf Sie bei Anbieter-Wahl, RAG-Aufbau und Integration achten müssen.

12 Min. Lesezeit2. Mai 2026

„Wir wollen einen Chatbot, der unsere Kunden-Fragen aus unseren eigenen Handbüchern beantwortet – aber DSGVO-konform." Diesen Satz hören wir wöchentlich. Die gute Nachricht: Genau das ist 2026 technisch machbar. Die unbequemere Nachricht: Nicht jede Architektur, die online angepriesen wird, ist es auch.

Zwischen einem KI-Chatbot, der schnell live geht, und einem, der bei einer Datenschutz-Prüfung besteht, liegen handfeste Architektur-Entscheidungen: Welcher Anbieter, welches Modell, in welcher Region, mit welchem AVV, mit welchem RAG-Setup, hinter welchem Consent-Banner. Wer einen eigenen KI-Chatbot seriös plant, sollte die folgenden Bausteine alle einmal gesehen haben – sonst wird aus dem Pilotprojekt schnell ein Bußgeld-Risiko.

Vom Use-Case zum Live-Chatbot: 4 Phasen

Reihenfolge ist nicht beliebig – wer Phase 2 überspringt, baut Schulden

1. Use-Case
Was beantwortet er?ErfolgskriteriumKein-Daten-Liste
Briefing
2. Architektur
Modell + RegionAVV + TIASpeicherdauer
DSGVO-Setup
3. Daten-Setup
RAG-KorpusVektor-DBVerschlüsselung
Wissensbasis
4. Go-Live
Consent-BannerMonitoringFeedback-Loop
Betrieb

Die häufigsten Fehler entstehen durch Springen von Phase 1 direkt zu Phase 4

Wann ein eigener KI-Chatbot überhaupt sinnvoll ist

Bevor wir über DSGVO sprechen, lohnt die ehrliche Vor-Frage: Brauchen Sie überhaupt einen KI-Chatbot? In vielen Fällen ist eine gut gepflegte FAQ-Seite mit Volltextsuche das bessere Werkzeug – billiger, schneller, kontrollierbarer. Ein KI-Chatbot lohnt sich vor allem, wenn drei Bedingungen zusammenkommen.

1. Sie haben einen substantiellen, gepflegten Wissens-Bestand

Handbücher, Produktdatenblätter, FAQ-Sammlungen, Wissens-Wikis, Vertragsmuster – Inhalte, die so umfangreich sind, dass eine reine Suche an Grenzen stößt. Unter etwa 50 substanziellen Dokumenten lohnt sich der Aufwand selten.

2. Die Fragen Ihrer Nutzer sind variabel formuliert

Wenn Kunden in zwanzig verschiedenen Formulierungen dasselbe meinen („Wie kündige ich?", „Vertrag beenden", „Stornierung möglich?"), spielt ein KI-Chatbot seine Stärke aus: Er versteht Bedeutungs-Ähnlichkeit, eine klassische Volltextsuche nicht. Wenn Ihre Fragen sehr standardisiert sind, reicht eine FAQ.

3. Sie haben Volumen, das den Aufwand rechtfertigt

Ein KI-Chatbot zu betreiben, kostet mehr als eine FAQ – Modell-Kosten, Wartung, Daten-Pflege, Monitoring. Ab mehreren hundert relevanten Anfragen pro Monat (Support, Vertrieb, interne Wissens-Recherche) wird er finanziell sinnvoll. Darunter ist die Investition meist schwer zu begründen.

Wenn auch nur eine Bedingung deutlich nicht erfüllt ist, sollten Sie ehrlich prüfen, ob nicht eine strukturierte FAQ-Seite das Bessere wäre. Sie ist günstiger, datenschutzrechtlich unproblematisch und ohnehin die Grundlage, auf der ein späterer KI-Chatbot dann aufsetzen kann.

Praxis-Tipp: Mit einem klaren Pilot-Use-Case starten

Statt „Chatbot, der alles kann" lieber einen klar abgegrenzten Pilot-Use-Case definieren – z. B. „beantwortet Fragen zu unseren 30 meistverkauften Produkten aus dem Datenblatt-Bestand". Pilot live, Feedback einsammeln, dann Scope erweitern. Wer mit zu großem Scope startet, verliert sich im Daten-Aufbau und kommt nie live.

Wo die DSGVO bei KI-Chatbots einhakt

Ein KI-Chatbot verarbeitet personenbezogene Daten, sobald jemand mit ihm spricht – mindestens IP, Session-ID und den Konversations-Inhalt. Damit greifen mehrere DSGVO-Pflichten gleichzeitig.

1. Rechtsgrundlage und Einwilligung

Die Verarbeitung muss eine Rechtsgrundlage haben (Art. 6 DSGVO). Bei Service-Chatbots ist das in der Regel die Einwilligung der Besucher:innen – verbunden mit einer transparenten Information, was passiert. Der Chat darf nicht „heimlich" mitlaufen.

2. Auftragsverarbeitung mit dem Modell-Anbieter

Wer ein gehostetes Modell nutzt (OpenAI, Azure-OpenAI, Mistral, Aleph Alpha), schließt einen Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO ab. Der AVV regelt, was der Anbieter mit den Daten tun darf – und vor allem, was nicht. Standard-AVV ohne Lesen unterschreiben ist riskant: Manche Anbieter behalten sich Trainings-Nutzung vor, andere nicht.

3. Drittlandtransfer (wenn US-Anbieter)

Sobald Daten in die USA fließen (klassische OpenAI-API, Anthropic-API ohne Sonderregelung), greift Art. 44 ff. DSGVO. Sie brauchen Standardvertragsklauseln, ein Transfer-Impact-Assessment und einen Hinweis in der Datenschutzerklärung. Die einfachere Variante: EU-Hosting wählen (Azure-OpenAI in EU-Region, Mistral, Aleph Alpha) – dann entfällt das Drittland-Thema.

4. Speicherdauer und Löschverfahren

Konversations-Logs dürfen nicht ewig gespeichert werden. Faustregel: 30–90 Tage Klar-Logs für Qualitäts-Sicherung, danach automatische Löschung oder Aggregation. Wer keine Lösch-Routine hat, sammelt ungewollt einen DSGVO-Schadensfall an.

5. Betroffenenrechte

Wenn jemand wissen will, was der Chatbot gespeichert hat, müssen Sie das in angemessener Zeit liefern können (Art. 15). Das setzt voraus, dass Konversationen einer identifizierbaren Person zuordenbar sind – und gleichzeitig schnell wieder gelöscht werden können (Art. 17). Das Verfahren dafür sollte vor Go-Live stehen, nicht erst, wenn die erste Anfrage kommt.

Praxis-Tipp: Drei DSGVO-Bausteine vor jedem Go-Live abhaken

Die häufigsten DSGVO-Schwachstellen bei KI-Chatbot-Projekten sind drei: fehlende Consent-Vorschaltung, fehlender oder unvollständiger AVV mit dem Tool-Anbieter und unklare Speicherdauer-Regeln. Alle drei sind mit überschaubarem Aufwand zu klären – aber nicht erst nach Go-Live, sondern davor. Wer diese drei Bausteine vor dem Live-Gang dokumentiert hat, vermeidet die typischen Notfall-Korrekturen und Abmahn-Risiken in den ersten Wochen.

Welche Architekturen DSGVO-konform sind

Drei Architektur-Pfade haben sich 2026 etabliert. Sie unterscheiden sich in Aufwand, Kosten und Modell-Qualität.

Azure-OpenAI EU

Modell: GPT-Familie (US-Modelle, EU-gehostet)

Region: Schweden, Frankfurt, Niederlande

AVV: Microsoft Enterprise-AVV

Drittland: formal innerhalb EU-Cloud

Mittelweg – etabliert, gut dokumentiert

EU-Anbieter (Mistral, Aleph Alpha)

Modell: EU-eigene Modelle, oft Open-Weight

Region: Frankreich, Deutschland

AVV: EU-rechtlich einfach

Drittland: entfällt

Datenschutz-einfach, Modell-Qualität wächst

On-Prem / Eigene GPU

Modell: Open-Weight (Llama, Mistral, Mixtral)

Region: Ihre eigene Infrastruktur

AVV: entfällt – kein externer Verarbeiter

Drittland: entfällt

Maximale Kontrolle, hoher Betriebs-Aufwand

Direkt OpenAI/Anthropic-API ohne Anpassung

Modell: Top-Qualität

Region: USA

AVV: Standard, oft ungeeignet

Drittland: ja, mit vollem Pflichtenheft

Vermeiden – ohne TIA und SCC nicht konform

Welcher Pfad für wen?

  • Azure-OpenAI EU: ein etablierter Weg für KMU – breit verfügbares Modell-Spektrum, EU-Region, Microsoft-Enterprise-AVV
  • EU-Anbieter: für Branchen mit hoher Datenschutz-Empfindlichkeit (Recht, Gesundheit, Behörden) und für Strategie-Wahl pro Souveränität
  • On-Prem: für Unternehmen mit eigener GPU-Infrastruktur, sehr sensiblen Daten oder strikten Compliance-Vorgaben (KRITIS, Bank, Versicherung)
  • Direkt-API ohne Anpassung: nur für reine interne Tests, niemals produktiv mit Kunden-Daten

Anbieter-Auswahl: Cloud, EU-Cloud oder On-Prem

Die Anbieter-Auswahl hängt an fünf Kriterien, die alle gleichzeitig passen müssen. Wer nur auf eines schaut, baut sich Schulden ein.

1. Modell-Qualität für den Use-Case

Nicht jeder Use-Case braucht das stärkste Modell. Für Standard-FAQ reicht ein mittelgroßes Modell, das deutlich günstiger und schneller ist. Für komplexe Reasoning-Aufgaben (Vertrags-Analyse, juristische Recherche) lohnt das Top-Modell. Faustregel: Mit dem mittelgroßen Modell starten, eskalieren nur dort, wo es nachweislich nicht reicht.

2. Region und Hosting

EU-Region ist 2026 für die allermeisten DSGVO-Setups der einfachere Weg. US-Hosting ist möglich, aber bedeutet zusätzlichen Aufwand (Standardvertragsklauseln, Transfer-Impact-Assessment, Datenschutzerklärung). Wer das nicht leisten will: EU-Region wählen.

3. AVV und Trainings-Nutzung

Lesen Sie den AVV, vor allem den Abschnitt zur Trainings-Nutzung. Manche Anbieter trainieren Standard-Modelle mit den eingehenden Daten, sofern Sie nicht ausdrücklich widersprechen (Opt-out). Bei DSGVO-Setups sollte Trainings-Nutzung standardmäßig deaktiviert sein – lieber Anbieter wählen, die das so anbieten.

4. SLA und Verfügbarkeit

Wenn der Chatbot Kunden-relevant ist, muss die Verfügbarkeit stimmen. Achten Sie auf SLA-Zusagen, Fallback-Strategien und Monitoring-Möglichkeiten. Ein Chatbot, der einmal pro Woche ausfällt, ist schlimmer als keiner.

5. Vendor-Lock-in

Bauen Sie die Architektur so, dass das Modell austauschbar ist – RAG-Schicht, Daten-Schicht und Frontend sollten unabhängig vom konkreten Modell sein. So können Sie 2027 ohne Komplett-Umbau auf einen besseren Anbieter wechseln, falls sinnvoll.

RAG: Wie der Chatbot auf Ihre Daten zugreift

RAG (Retrieval-Augmented Generation) ist 2026 der Standard, um einen Chatbot mit eigenem Firmenwissen zu versorgen, ohne ein Modell kostenintensiv zu trainieren. Funktionsweise in drei Schritten.

Schritt 1: Korpus aufbauen

Ihre Inhalte – PDFs, Word-Dokumente, Webseiten, Handbücher, FAQs – werden gesammelt, in Text konvertiert, in Abschnitte zerlegt („Chunks", typisch 200–800 Tokens) und mit Meta-Daten angereichert (Quelle, Datum, Bereich). Saubere Chunk-Strategie ist die wichtigste Vorarbeit – wer hier schlampt, bekommt später schlechte Antworten.

Schritt 2: Vektor-Datenbank befüllen

Jeder Chunk wird durch ein Embedding-Modell in einen Vektor (eine mathematische Darstellung der Bedeutung) umgewandelt und in einer Vektor-Datenbank gespeichert. EU-fähige Optionen 2026: Postgres mit pgvector, Weaviate, Qdrant – alle als EU-Cloud oder selbst gehostet verfügbar.

Schritt 3: Retrieval und Antwort

Bei einer Frage wird die Frage selbst in einen Vektor verwandelt, die ähnlichsten Chunks aus der Datenbank gezogen, und das Sprachmodell bekommt diese Chunks plus die Frage als Kontext. Es formuliert dann eine Antwort, die nur auf den gefundenen Chunks beruht – nicht auf dem Welt-Wissen des Modells.

Warum RAG für DSGVO-Setups so wichtig ist

  • Ihre Daten verlassen nie Ihre Kontrolle – sie liegen in Ihrer Vektor-DB, nicht im Modell
  • Das Modell „lernt" nichts dazu – jede Antwort ist on-demand, keine Trainings-Vermischung
  • Quellen sind nachvollziehbar – Sie können jede Antwort auf konkrete Dokumente zurückführen
  • Inhalte aktualisieren ist trivial – Datei austauschen, neu indexieren, fertig
  • Datenschutz-Lösch-Anfragen lassen sich umsetzen – Eintrag aus Vektor-DB löschen, ohne Modell anzufassen

Fine-Tuning eines Modells auf Ihre Daten ist 2026 nur in Ausnahmefällen sinnvoll – etwa, wenn Sie einen sehr spezifischen Schreibstil oder eine Fach-Terminologie brauchen, die das Basis-Modell nicht kennt. Für reine Wissens-Vermittlung ist RAG fast immer die bessere Wahl.

Integration in die Website

Ein DSGVO-konformer Chatbot lädt nicht beim ersten Seitenaufruf das komplette Skript. Wer das macht, holt sich dieselben Probleme, die Cookie-Banner-Verstöße produzieren – nur mit deutlich sensibleren Daten.

Empfohlene Integration

  • Eigene Chat-Detail-Seite mit klarer Erklärung, was passiert, statt Floating-Widget auf jeder Seite
  • Skript wird erst nach Klick geladen – kein Hintergrund-Tracking, kein Auto-Open
  • Consent-Banner-Vorschaltung für eingebettete Widgets, falls doch globale Einbindung
  • Sichtbarer Hinweis direkt am Chat: Anbieter, Region, Speicherdauer, Link zur Datenschutzerklärung
  • Möglichkeit, die Konversation zu löschen – sofort, mit einem Klick, ohne Account

Nicht empfohlen

  • Floating-Widget über jeder Seite, das automatisch aufpoppt
  • Drittanbieter-Skripte ohne Consent vor dem Laden
  • Versteckte Tracking-Pixel im Chat-Verlauf
  • Speicherdauer „bis auf Widerruf" ohne automatische Löschung
  • Verzicht auf Datenschutz-Hinweis am Chat selbst

Wer einen Chatbot später produktiv betreibt, sollte zusätzlich Monitoring und Feedback-Loop einbauen: Welche Fragen kommen oft? Welche Antworten waren schlecht? Wo greift der Bot daneben? Ohne diese Schleife veraltet der Korpus und die Antwort-Qualität sinkt.

Häufiger Fehler: Sensible Daten in den Chat einlassen

Ohne technische Vorkehrungen geben Nutzer:innen oft mehr preis, als sie sollten – Symptome, Vertragsdetails, Personen-IDs. Bauen Sie ein Filter-System ein, das offensichtlich sensible Eingaben erkennt und den Bot freundlich abwürgen lässt: „Bitte teilen Sie hier keine gesundheitsbezogenen oder personenbezogenen Daten mit – wenden Sie sich für solche Anfragen an unser Team unter …".

Häufige Fehler bei der Einführung

Bei der Bewertung von KI-Chatbot-Pilotprojekten wiederholen sich sechs Stolperstellen.

1
OpenAI-API direkt eingebunden

US-Drittland ohne TIA und SCC – DSGVO-Verstoß

2
Kein AVV mit dem Modell-Anbieter

Verarbeitung ohne Vertrag – Bußgeldrisiko

3
Konversations-Logs ohne Lösch-Routine

Unbegrenzte Speicherung verletzt Art. 5 Abs. 1 lit. e

4
Skript ohne Consent vor Klick geladen

Drittanbieter-Tracking ohne Einwilligung

5
Korpus ohne Quellen-Zuordnung

Antworten nicht belegbar – kein Vertrauen, keine Korrektur

6
Kein Filter für sensible Eingaben

Nutzer geben mehr preis, als sie sollten – kein Schutz

Punkte 1–3 sind die juristisch kritischen Fehler – Punkte 4–6 die qualitäts- und vertrauenskritischen

So führen Sie einen DSGVO-konformen KI-Chatbot ein

Eine saubere Einführung läuft in sechs Schritten. Wer sie der Reihe nach abarbeitet, hat in vier bis sechs Wochen einen Pilot live, der datenschutzrechtlich belastbar ist.

  1. Use-Case definieren: Was beantwortet der Bot konkret? Ein klar abgegrenzter Pilot, nicht „alles".
  2. Architektur wählen: Azure-OpenAI EU, EU-Anbieter oder On-Prem – mit Begründung pro Wahl.
  3. DSGVO-Setup: AVV unterschreiben, Datenschutzerklärung erweitern, Speicherdauer festlegen, Lösch-Routine einrichten.
  4. RAG-Korpus aufbauen: Dokumente aussuchen, sauber chunken, mit Meta-Daten anreichern, in Vektor-DB indexieren.
  5. Integration entwickeln: eigene Chat-Detail-Seite, Consent-Vorschaltung, sichtbarer Datenschutz-Hinweis am Chat.
  6. Pilot live + Monitoring: mit kleinem Nutzerkreis starten, Antworten prüfen, Korpus iterieren, dann ausrollen.
Use-Case auf einer Seite festgehalten

Was beantwortet er, was nicht, mit welchem Erfolgskriterium

EU-Hosting für Modell und Vektor-DB

Azure EU-Region, Mistral, Aleph Alpha oder On-Prem

AVV mit Modell-Anbieter unterschrieben

Trainings-Nutzung deaktiviert, Speicherdauer geregelt

Datenschutzerklärung erweitert

Anbieter, Modell, Region, Daten, Speicherdauer, Betroffenenrechte

Consent-Vorschaltung für Chat-Skript

Skript lädt erst nach Klick / nach Cookie-Einwilligung

Lösch-Routine für Konversations-Logs aktiv

Automatische Löschung nach 30–90 Tagen, dokumentiert

Chatbot, der Ihnen gehört – nicht dem Anbieter

Ein KI-Chatbot, der wirklich auf Ihre Firmendaten antwortet und gleichzeitig DSGVO-konform läuft, ist 2026 kein Forschungsthema mehr, sondern etabliertes Handwerk – wenn die Architektur stimmt. EU-Hosting, RAG statt Fine-Tuning, sauberer AVV, klare Speicherdauer, Consent-Vorschaltung. Wer diese fünf Bausteine berücksichtigt, baut einen Bot, der bei einer Datenschutz-Prüfung besteht.

Wer sie ignoriert, baut schnell live, aber mit dem Risiko, hinterher unter Zeitdruck umzubauen – oder Bußgelder zu riskieren. Der Pilot-Ansatz mit klar abgegrenztem Use-Case und EU-konformer Architektur ist der pragmatische Weg. Ein strategischer Blick auf KI-Sichtbarkeit ergänzt das gut: Wer mit eigenen Inhalten in KI-Antworten erscheint, baut Reichweite – wer einen eigenen KI-Chatbot betreibt, baut Service-Tiefe.

ÜBER DIE AUTORIN
Dagmar Seebo, Geschäftsführerin von ProXWorks®Dagmar Seebo

Dagmar Seebo, B.A., ist seit 1999 im E-Commerce tätig. Als Geschäftsführerin von ProXWorks® verbindet sie über 27 Jahre Marketing-Erfahrung mit digitalem Know-how.

Die Inhalte entstehen unter redaktioneller Verantwortung und fachlicher Prüfung unter Einsatz moderner KI-gestützter Systeme.

Häufig gestellte Fragen

Antwort in 2 Werktagen

Wir prüfen in 2 Werktagen, ob Ihr KI-Chatbot-Vorhaben DSGVO-konform umsetzbar ist – und welche Architektur konkret passt.

KI-Chatbot-Check anfordern