Deepfake

Ein Deepfake ist ein mit künstlicher Intelligenz erzeugtes oder verändertes Medium – Bild, Video oder Ton –, das eine reale Person täuschend echt etwas sagen oder tun lässt, das nie stattgefunden hat.

Ein Deepfake ist ein Sonderfall der synthetischen Medien: Während ein synthetisches Medium beliebige Inhalte erzeugen kann, bildet ein Deepfake gezielt eine identifizierbare reale Person nach.

In einfachen Worten

Deepfakes entstehen, indem ein KI-Modell aus vorhandenem Bild- oder Tonmaterial einer Person deren Aussehen, Mimik oder Stimme erlernt und anschließend neu zusammensetzt. Das Ergebnis kann ein verändertes Video sein, ein ausgetauschtes Gesicht in einer Live-Übertragung oder eine künstlich erzeugte Stimme – siehe Stimm-Klon. Technisch unterscheidet man zwei Konstellationen: Im ersten Fall existiert die gezeigte Person gar nicht, ihr Gesicht ist vollständig erfunden. Im zweiten Fall wird die Identität eines realen Menschen missbraucht, dessen Aufnahmen als Vorlage dienen, während im Hintergrund jemand anderes agiert. Die nötige Technik ist von spezialisierter Software zu breit verfügbaren Anwendungen geworden, die teils in Echtzeit arbeiten. Deepfakes gehören damit in dieselbe Familie wie die KI-Bildgenerierung, zielen aber nicht auf neue Motive, sondern auf die täuschend echte Nachbildung eines bestimmten Menschen.

Wozu brauche ich das?

Für Unternehmen ist weniger die Technik selbst relevant als die Frage, wo sie Schaden anrichtet. Drei Kontexte stechen hervor: die Freigabe von Zahlungen auf Zuruf einer scheinbar bekannten Person, die Identitätsprüfung im Bewerbungs- oder Vertragsprozess und die Reputation, wenn gefälschte Aufnahmen einer Führungskraft in Umlauf geraten. Das gemeinsame Muster: Ein audiovisueller Eindruck, der lange als Echtheitsbeleg galt, trägt diese Beweislast nicht mehr allein. Als Gegenmittel greifen technische Verfahren wie die Liveness-Erkennung sowie organisatorische Prüfpunkte – etwa die Bestätigung über einen zweiten, unabhängigen Kanal.

Beispiel aus der Praxis

Ein verbreitetes Szenario betrifft die Finanz-Freigabe: In einer Videokonferenz erscheint scheinbar die Geschäftsführung und weist eine eilige Überweisung an – Bild und Stimme wirken vertraut, der Zeitdruck ist hoch. Tatsächlich ist die Darstellung in Echtzeit gefälscht. Wo eine feste Regel gilt, dass Zahlungen nie allein aufgrund eines Anrufs oder Video-Calls freigegeben, sondern über einen zweiten, vorab vereinbarten Weg bestätigt werden, läuft die Inszenierung ins Leere. Der entscheidende Schutz ist hier nicht die Fähigkeit, den Deepfake mit bloßem Auge zu erkennen, sondern ein Prozess, der gar nicht erst von der Echtheit des Bildes abhängt.

Wirtschaftlicher Nutzen

Der wirtschaftliche Kern liegt im Vertrauensverlust gegenüber audiovisuellen Kanälen. Wenn Bild und Ton nicht mehr unbesehen als Identitätsnachweis taugen, müssen Prozesse, die bislang darauf bauten – Zahlungsfreigaben, Einstellungen, Vertragsabschlüsse aus der Ferne – um eigene Prüfpunkte ergänzt werden. Der Aufwand dafür ist überschaubar und betrifft vor allem Organisation und Schulung, nicht teure Technik. Dem steht ein Schadenspotenzial gegenüber, das von einer einzelnen Fehlüberweisung bis zu einem nachhaltigen Reputationsschaden reicht. Für den Mittelstand ist die wichtigste Erkenntnis, dass das Risiko nicht von der Unternehmensgröße abhängt, sondern davon, ob ortsunabhängige Abläufe ungeprüft auf dem bloßen Augenschein beruhen.

Typische Fehler

Den audiovisuellen Eindruck als Echtheitsnachweis behandeln – „Ich habe die Person ja gesehen und gehört" ist seit Echtzeit-Fälschungen kein Beleg mehr.
Allein auf das Erkennen mit bloßem Auge setzen, statt Prozesse zu schaffen, die nicht von der Echtheit des Bildes abhängen.
Zahlungs- und Freigabe-Prozesse ohne zweiten, unabhängigen Bestätigungs-Kanal betreiben.
Davon ausgehen, nur Prominente oder Großunternehmen seien betroffen – maßgeblich ist die ungeprüfte Fern-Abwicklung, nicht die Bekanntheit.
Mitarbeitende nicht für das Thema sensibilisieren, sodass im Ernstfall unter Zeitdruck improvisiert wird.

Worauf achten?

Feste Regel verankern: sensible Freigaben nie allein aufgrund von Bild oder Stimme, sondern über einen vorab vereinbarten zweiten Weg.
Spontane, nicht angekündigte Interaktionen einplanen, wenn Identität im Video eine Rolle spielt – eine Echtzeit-Fälschung gerät dabei an ihre Grenzen.
Den Schutz organisatorisch denken, nicht primär technisch – der zuverlässigste Schutz ist ein Prozess, der ohne Echtheits-Annahme auskommt.
Verdachtsfälle ruhig und dokumentiert behandeln, nicht im laufenden Gespräch konfrontieren.
Datenschutz beachten, sobald biometrische Merkmale verarbeitet oder Aufnahmen gespeichert werden – siehe DSGVO.

Häufig gestellte Fragen

Was ist ein Deepfake?

Ein mit künstlicher Intelligenz erzeugtes oder verändertes Bild, Video oder Tondokument, das eine reale Person täuschend echt etwas sagen oder tun lässt, das nie stattgefunden hat. Grundlage ist ein Modell, das Aussehen oder Stimme der Person aus vorhandenem Material erlernt.

Sind Deepfakes nur ein Problem für Prominente?

Nein. Im Geschäftsumfeld betrifft das Risiko vor allem ortsunabhängige Abläufe – Zahlungsfreigaben auf Zuruf, Identitätsprüfungen aus der Ferne oder Bewerbungsgespräche. Maßgeblich ist nicht die Bekanntheit einer Person, sondern ob ein Prozess ungeprüft auf dem audiovisuellen Eindruck beruht.

Wie schützt man sich gegen Deepfakes?

Am zuverlässigsten organisatorisch: sensible Freigaben über einen zweiten, vorab vereinbarten Kanal bestätigen, spontane Live-Interaktionen einbauen und Mitarbeitende sensibilisieren. Technische Verfahren wie die Liveness-Erkennung ergänzen diesen Schutz, ersetzen ihn aber nicht.

Kann man Deepfakes zuverlässig erkennen?

Mit bloßem Auge zunehmend schwerer, da die Qualität steigt. Hinweise liefern Unstimmigkeiten bei Lippenbewegung, Rändern oder Beleuchtung. Verlässlicher als das Erkennen ist ein Prozess, der gar nicht erst von der Echtheit eines Bildes abhängt.

Zurück zu KI & Automation