Zum Hauptinhalt springen
Didit erhält 7,5 Mio. $ für die Infrastruktur für Identität und Betrug
Didit
Zurück zum Blog
Blog · 27. März 2026

Gefälschte Bewerber sind da: Wie KI eine neue Welle von Betrug bei der Einstellung befeuert (DE)

KI-Deepfakes ermöglichen es nun jedem, in 70 Minuten ein gefälschter Bewerber zu werden. Erfahren Sie, wie Voice-Cloning, Echtzeit-Gesichtstausch und generative KI die Personalbeschaffung untergraben – und wie biometrische.

Von DiditAktualisiert
deepfake-candidates-ai-hiring-fraud.png

Es dauert 70 Minuten. So lange benötigt jemand ohne technische Vorkenntnisse, um einen überzeugenden Deepfake-Bewerber zu erstellen – komplett mit einem synthetischen Gesicht, geklontem Stimme und einer gefälschten beruflichen Vergangenheit. Laut HR Dive kann der gesamte Prozess vom Herunterladen von Open-Source-Tools bis zum Durchführen eines Echtzeit-Gesichtstauschs in einem Videoanruf in etwas mehr als einer Stunde abgeschlossen werden.

Dies ist keine theoretische Bedrohung. Es geschieht gerade jetzt, in großem Umfang, und die meisten Einstellungsteams sind nicht darauf vorbereitet, es zu erkennen.

Das Ausmaß des Problems

Die Zahlen zeichnen ein alarmierendes Bild. 50 % der Unternehmen geben an, bereits auf KI-gestützten Deepfake-Betrug gestoßen zu sein, so CBS News. Auf Bewerberseite haben 39 % der Jobsuchenden im Jahr 2024 KI bei ihrem Bewerbungsprozess eingesetzt (Gartner Q4/24), und 28 % der Bewerber geben zu, KI zur Erstellung gefälschter Arbeitsproben verwendet zu haben (Greenhouse 2025 Candidate Fraud Report).

Aber die Verwendung von ChatGPT zur Verbesserung eines Anschreibens ist etwas anderes. Sich bei einem Video-Interview als völlig andere Person zu präsentieren – mit einem synthetischen Gesicht, das in Echtzeit über Ihr eigenes gelegt wird – ist etwas ganz anderes. Das ist die Grenze, die wir überschritten haben.

Vielleicht am aussagekräftigsten: 62 % der Personalverantwortlichen glauben jetzt, dass Jobsuchende besser darin sind, Kompetenz mit KI vorzutäuschen, als HR-Teams darin, dies zu erkennen. Die Asymmetrie ist das Problem. Deepfake-Tools verbessern sich schneller, als das menschliche Auge mithalten kann.

Wie Deepfake-Technologie bei Einstellung-Betrug funktioniert

Das Deepfake-Handbuch für die Einstellung umfasst typischerweise drei Ebenen der Täuschung, die jeweils durch immer zugänglichere KI-Tools unterstützt werden.

Synthetische Identitätskonstruktion

Der erste Schritt ist der Aufbau eines Kandidaten, der nicht existiert. Generative Adversarial Networks (GANs) erzeugen fotorealistische Kopfaufnahmen, die Reverse-Image-Suchen bestehen. Large Language Models generieren polierte Lebensläufe, Anschreiben und sogar Code-Portfolios, die auf bestimmte Stellenbeschreibungen zugeschnitten sind. LinkedIn-Profile werden mit synthetischen Verbindungsnetzwerken gefälscht. Der „Kandidat“ hat einen digitalen Fußabdruck, der bei oberflächlicher Betrachtung legitim aussieht.

Echtzeit-Gesichtstausch bei Videoanrufen

Hier wird die Technologie gefährlich. Tools wie DeepFaceLive, FaceFusion und proprietäre Alternativen können ein synthetisches Gesicht in Echtzeit über einen Live-Videostream legen. Die Latenz ist so gering, dass die Ausgabe auf Plattformen wie Zoom, Google Meet und Microsoft Teams natürlich aussieht.

In Juni 2025 demonstrierte Pindrop genau, wie einfach dies ist. Während einer Live-Demo für Reporter verwandelte ihr Team das Gesicht eines Journalisten in Echtzeit während eines Zoom-Anrufs – der Tausch war so nahtlos, dass er bei einem typischen Vorstellungsgespräch unbemerkt bleiben würde. Die Mimik, Kopfbewegungen und Lippensynchronisation des Journalisten wurden alle überzeugend auf das synthetische Gesicht abgebildet.

Die zugrunde liegende Technik basiert auf der Erkennung von Gesichtsschlüsselpunkten, Mesh-Warping und neuronalem Rendering. Ein Quellgesicht wird in eine Reihe von Schlüsselpunkten – Augen, Nase, Mund, Kieferlinie – zerlegt, und eine Zielflächentextur wird Frame für Frame über diese Punkte gerendert. Moderne Implementierungen laufen mit 30+ Bildern pro Sekunde auf Consumer-Grade-GPUs.

Sprachklonen und Sprachsynthese

Wenige Sekunden Audio reichen aus. Sprachklonmodelle wie die von ElevenLabs, Resemble AI und Open-Source-Alternativen können synthetische Sprache erzeugen, die den Ton, das Tempo und den Akzent einer Zielstimme anpasst. In Kombination mit einem Echtzeit-Gesichtstausch ermöglicht dies ein „Proxy-Interview“, bei dem die Person, die die Fragen beantwortet, nicht die Person ist, die sich beworben hat.

Die Stimme muss nicht einmal von dem eigentlichen Kandidaten geklont werden. Betrüger können vollständig synthetische Stimmen generieren, die einfach professionell und konsistent klingen. Das Ziel ist nicht die perfekte Nachbildung – es ist plausible Leugnung.

Das Proxy-Interview-Problem, verstärkt

Proxy-Interviews sind nicht neu. Kandidaten bezahlen seit Jahren andere, um in ihrem Namen ein Interview zu führen, insbesondere in technischen Rollen, in denen Codierungsüberprüfungen von einem qualifizierteren Stellvertreter durchgeführt werden können. Was KI verändert hat, ist die Senkung der Eintrittsbarriere und die Ausgereiftheit der Täuschung.

Vor Deepfakes erforderten Proxy-Interviews, dass der Stellvertreter dem Kandidaten physisch ähnelte oder Audio-Only-Anrufe ausnutzte. Jetzt kann der Stellvertreter wie jeder aussehen und klingen. Ein einziger „Interview-Coach“ kann gleichzeitig Dutzende gefälschte Kandidaten betreuen und Gesichter im Flug austauschen.

Die Wirtschaftlichkeit ist einfach. Ein Proxy-Service berechnet einige tausend Dollar. Wenn der gefälschte Kandidat eine Remote-Position mit einem sechsstelligen Gehalt findet und auch nur ein paar Monate lang Gehalt bezieht, bevor er entdeckt wird, ist der ROI enorm – für den Betrüger.

Der KnowBe4-Fall: Wenn ein Nationalstaat das Spiel spielt

Das beunruhigendste Beispiel bisher betrifft KnowBe4, das Unternehmen für Cyber-Security-Awareness-Schulungen. Im Jahr 2024 stellte KnowBe4 ein, was sie für einen legitimen Softwareentwickler hielten. Der Kandidat bestand mehrere Video-Interviews, Hintergrundprüfungen und Referenzüberprüfungen.

Der „Kandidat“ war tatsächlich ein nordkoreanischer Agent. Er hatte ein KI-verbessertes Stockfoto verwendet, das mit echten Gesichtsmerkmalen überlagert wurde, um die Videoüberprüfung zu bestehen. Die gefälschte Identität umfasste gestohlene persönliche Informationen eines echten US-Bürgers in Kombination mit der synthetischen visuellen Ebene.

KnowBe4 entdeckte den Betrug erst, als der neu ausgestellte Firmenlaptop versuchte, Malware im Firmennetzwerk zu installieren. Der Agent hatte nie die Absicht gehabt, die Arbeit zu verrichten – das Ziel war die Netzinfiltration.

Was diesen Fall kritisch macht, ist die Tatsache, dass KnowBe4 ein Sicherheitsunternehmen ist. Sie sind darauf spezialisiert, Social Engineering zu erkennen. Wenn ihr Einstellungsprozess getäuscht wurde, sollte jedes Unternehmen davon ausgehen, dass sein eigener Prozess ebenfalls anfällig ist.

Der KnowBe4-Vorfall war keine isolierte Operation eines Nationalstaates. Er stellt ein Handbuch dar, das jetzt jedem mit grundlegenden technischen Kenntnissen und den richtigen Open-Source-Tools zur Verfügung steht.

Warum traditionelle Erkennungsmethoden versagen

Einstellungsteams haben mehrere Gegenmaßnahmen versucht, und die meisten davon scheitern.

Das menschliche Auge reicht nicht aus

51 % der Personalverantwortlichen stimmen zu, dass KI es schwieriger macht, virtuellen Interviews zu vertrauen. Die visuellen Artefakte, die frühe Deepfakes erkennbar machten – unheimlich wirkende Hauttexturen, Flackern an den Haaransätzen, falsch ausgerichtete Beleuchtung – wurden in aktuellen Tools weitgehend beseitigt. Bei der typischen Auflösung und Komprimierung von Videoanrufen (720p, variable Bitrate) sind Deepfake-Artefakte oft nicht von normalem Videokomprimierungsrauschen zu unterscheiden.

Hintergrundprüfungen verpassen synthetische Identitäten

Traditionelle Hintergrundprüfungen überprüfen, ob eine reale Person mit dem angegebenen Namen, der Adresse und der Beschäftigungshistorie existiert. Sie überprüfen nicht, ob die Person im Videoanruf diese Person ist. Eine synthetische Identität, die auf gestohlenen PII basiert, besteht eine Hintergrundprüfung problemlos – genau wie im Fall KnowBe4.

Referenzüberprüfungen sind leicht zu manipulieren

Referenzen können gefälscht, an Komplizen ausgelagert oder sogar von KI-Sprachagenten generiert werden, die das Telefon beantworten und vorgefertigte Empfehlungen geben. Der gesamte Referenzprüfungsprozess setzt gutgläubige Teilnahme voraus, was genau von Betrugsoperationen ausgenutzt wird.

Technische Bewertungen überprüfen keine Identität

Codierungsherausforderungen, Hausaufgaben und Live-Technische-Screens überprüfen, ob jemand die Arbeit erledigen kann. Sie überprüfen nicht, ob die Person, die die Arbeit erledigt, die Person ist, die am ersten Tag zur Arbeit erscheint. Im Proxy-Interview-Modell wird die technische Bewertung vom qualifizierten Stellvertreter durchgeführt, und der eigentliche „Mitarbeiter“ fährt mit vorgefertigten Skripten und KI-Assistenten mit.

Der Rückkehr-ins-Büro-Interview-Rückzug

Angesichts des Deepfake-Problems haben einige der weltweit größten Unternehmen den direktesten Ansatz gewählt: Kandidaten dazu zu zwingen, persönlich zu erscheinen.

In Mitte 2025 führten sowohl Google als auch McKinsey obligatorische persönliche Interviews für Schlüsselpositionen wieder ein, so die Wall Street Journal. Sie sind nicht allein – 72 % der Unternehmen bekämpfen derzeit KI-gestützten Bewerberbetrug, indem sie in einem Stadium des Einstellungsprozesses persönliche Interviews erfordern.

Die Logik ist einfach. Es ist sehr schwierig, jemanden zu deepfaken, wenn er Ihnen gegenüber sitzt. Physische Präsenz ist der ultimative Lebenderkennungstest.

Warum In-Person keine skalierbare Lösung ist

Dieser Ansatz hat jedoch erhebliche Einschränkungen.

Geografische Ausschließung. Die Forderung, dass Kandidaten für ein Vorstellungsgespräch in ein Büro einfliegen müssen, schränkt den Talentpool sofort ein. Unternehmen, die ihre Employer Brand auf Remote-First-Einstellung aufgebaut haben, sagen nun Kandidaten, dass sie persönlich erscheinen müssen – manchmal über Zeitzonen oder internationale Grenzen hinweg. Dies schließt unverhältnismäßig Kandidaten aus Schwellenländern, Kandidaten mit Behinderungen und solche aus, die sich den Reiseaufwand auf Spekulation nicht leisten können.

Kosten und Geschwindigkeit. Persönliche Interviews verlängern die Einstellungsdauer um Tage oder Wochen und verursachen Tausende von Dollar an Reisekosten pro Kandidat. Bei hochvolumigen Stellen funktioniert die Rechnung nicht.

Es löst nur einen Schritt. Selbst wenn das Interview persönlich stattfindet, bleiben die Einarbeitung, die fortlaufende Authentifizierung und die tägliche Arbeitsüberprüfung Remote. Ein entschlossener Betrüger könnte eine echte Person zu dem persönlichen Interview schicken und dann einen Stellvertreter für die eigentliche Remote-Arbeit einsetzen.

Das persönliche Mandat ist ein stumpfes Instrument. Es behebt das Symptom – gefälschte Videoanrufe – ohne das zugrunde liegende Problem zu lösen: Es gibt keine kryptografische Verbindung zwischen der Person, die das Interview führt, und der Person, die arbeitet.

Wie biometrische Lebenderkennung Deepfakes vereitelt

Das technologische Gegenmittel gegen gefälschte Kandidaten besteht nicht darin, alle in einen Konferenzraum zu zwingen. Es ist die biometrische Lebenderkennung – dieselbe Technologie, die im Finanzwesen zur Verhinderung von Identitätsbetrug im großen Maßstab eingesetzt wird.

Passive Lebenderkennung-Analyse

Moderne Lebenderkennung erfordert keine bestimmte Aktion des Benutzers. Passive Lebenderkennungssysteme analysieren unwillkürliche biologische Signale, die Deepfakes nicht replizieren können: natürliche Blinzelmuster, Mikroausdrücke, Hauttextur auf Subpixel-Ebene, Blutflussmuster, die sich durch Veränderungen der Hautfarbe zeigen (Remote-Photoplethysmographie), und das 3D-Tiefenprofil eines echten Gesichts im Vergleich zu einer flachen Wiedergabe.

Diese Signale werden von neuronalen Netzen analysiert, die mit Millionen von echten und synthetischen Gesichtsproben trainiert wurden. Aktuelle Systeme, die gemäß iBeta Level 1-Standards zertifiziert sind, erreichen eine Genauigkeit von 99,9 % bei der Unterscheidung zwischen echten Gesichtern und Deepfakes, gedruckten Fotos, Bildschirmwiedergaben und 3D-Masken.

Der entscheidende Vorteil ist, dass die passive Lebenderkennung für den Benutzer unsichtbar ist. Es gibt nichts zu manipulieren, da der Kandidat nicht genau weiß, was gemessen wird.

Aktive Lebenderkennung mit randomisierten Herausforderungen

Für Szenarien mit höherer Sicherheit fügt die aktive Lebenderkennung randomisierte Benutzeraktionen hinzu – drehen Sie Ihren Kopf nach links, blinzeln Sie zweimal, lächeln Sie. Da die Herausforderungen zum Zeitpunkt der Überprüfung zufällig generiert werden, schlagen vorab aufgezeichnete Videoangriffe fehl. Ein Deepfake, der in Echtzeit läuft, müsste die randomisierte Anweisung mit Null-Latenz und perfekter Genauigkeit in die korrekte Gesichtsbewegung übersetzen – eine Herausforderung, die aktuelle Face-Swap-Modelle nicht zuverlässig bewältigen können.

Gesichtsanpassung 1:1 anhand eines amtlichen Ausweises

Die leistungsstärkste Anwendung für die Einstellung ist Face Match: Der Vergleich der biometrischen Daten der Person im Videoanruf mit einem verifizierten, amtlichen Ausweis. Das System extrahiert einen Facial Embedding – eine 512-dimensionale mathematische Darstellung der Gesichtsgeometrie – sowohl aus der Live-Aufnahme als auch aus dem Ausweisbild und berechnet dann eine Ähnlichkeitsbewertung.

Dies schafft die kryptografische Verbindung, die traditionelle Einstellungen nicht haben. Die Person, die ihre Identität verifiziert, ist nachweislich dieselbe Person, die zum Vorstellungsgespräch kommt, und – entscheidend – dieselbe Person, die am ersten Tag zur Arbeit erscheint.

Warum Deepfakes die biometrische Lebenderkennung nicht schlagen können

Deepfake-Gesichtstausche arbeiten auf Pixelebene – sie manipulieren das visuelle Erscheinungsbild eines Gesichts. Biometrische Lebenderkennung arbeitet auf der Signalebene** – sie analysiert Tiefe, Textur, Bewegung und unwillkürliche biologische Reaktionen, die unter der Pixeloberfläche existieren.

Ein Deepfake kann wie ein echtes Gesicht aussehen. Er kann das subkutane Blutflussmuster eines echten Gesichts nicht replizieren. Er kann kein korrektes Infrarotreflexionsprofil erzeugen. Er kann die Mikro-Zitternmuster echter Gesichtsmuskeln nicht erzeugen. Dies sind die Signale, die die Lebenderkennung erfasst, und sie stellen eine grundsätzlich andere Realitätsebene dar als die, die Deepfake-Modelle zu reproduzieren versuchen.

Aufbau eines Deepfake-sicheren Einstellungsprozesses

Die Lösung ist nicht ein einzelnes Tool – es ist eine mehrschichtige Verifizierungsarchitektur, die Deepfake-Betrug wirtschaftlich unrentabel macht.

Schritt 1: Identitätsprüfung bei der Bewerbung

Bevor ein Kandidat in die Interviewpipeline gelangt, wird seine Identität anhand eines amtlichen Ausweises mit biometrischer Lebenderkennung überprüft. Dies etabliert einen verifizierten Identitätsanker. Plattformen wie Didit bieten dies für 0,20 $ pro Lebenderkennung mit Gesichtsanpassung an – ein Bruchteil der 30 bis 100 $, die traditionelle Anbieter von Hintergrundprüfungen für weniger schlüssige Verifizierungen verlangen.

Schritt 2: Biometrische Neu-Verifizierung beim Interview

Zu Beginn jedes Video-Interviews führt der Kandidat eine kurze Lebenderkennung durch, die mit seiner verifizierten Identität aus Schritt 1 verglichen wird. Dies bestätigt, dass die Person im Anruf die verifizierte Person ist. Wenn jemand einen Proxy mit einem Deepfake-Overlay eingesetzt hat, wird die biometrische Nichtübereinstimmung sofort gemeldet.

Schritt 3: Kontinuierliche Authentifizierung während der Einarbeitung

Am ersten Tag führt der neue Mitarbeiter eine weitere biometrische Verifizierung durch. Sein Facial Embedding wird mit demselben verifizierten Identitätsanker abgeglichen. Dies schließt die Schleife, die persönliche Interviews nicht schließen können: die Gewährleistung der Identitätskontinuität von der Bewerbung bis zur Beschäftigung.

Schritt 4: Risikobasierte Eskalation

Nicht jede Rolle erfordert das gleiche Maß an Sicherheit. Ein Kundendienstmitarbeiter in einer überwachten Umgebung birgt andere Risiken als ein Remote-Softwareentwickler mit Zugriff auf Produktionssysteme. Die Intensität der Verifizierung sollte mit dem Risikoprofil übereinstimmen – passive Lebenderkennung für Standardrollen, aktive Lebenderkennung mit Dokumentenprüfung für Positionen mit hohem Vertrauen.

Die Wirtschaftlichkeit der Prävention

Die Kostenrechnung ist drastisch. Ein betrügerischer Mitarbeiter in einer technischen Rolle kann Hunderte von Tausend Dollar Schaden anrichten – durch direkte Gehltsdiebstahl, Gefährdung des geistigen Eigentums, Kompromittierung des Netzwerks (wie im Fall KnowBe4) oder einfach durch die Kosten der Neueinstellung nach Entdeckung des Betrugs.

Biometrische Identitätsprüfung zum Zeitpunkt der Einstellung kostet einen Bruchteil eines Dollars pro Kandidat. Die Kapitalrendite wird nicht in Effizienzgewinne gemessen – sie wird in abgewendete Katastrophenverluste gemessen.

Die Unternehmen, die zu obligatorischen persönlichen Interviews zurückkehren, geben Tausende von Dollar pro Kandidat aus, um ein Problem zu lösen, das die biometrische Technologie für unter einem Dollar lösen kann. Die Kluft zwischen diesen beiden Ansätzen wird sich nur noch vergrößern, da sich die Deepfake-Tools weiter verbessern und das Volumen betrügerischer Bewerbungen zunimmt.

Was kommt als Nächstes

Das Problem mit gefälschten Bewerbern wird sich verschlimmern, bevor es besser wird. Die Tools werden zugänglicher, die Qualität der Ausgabe verbessert sich mit jeder Modellgeneration, und die finanziellen Anreize für Betrug steigen mit dem Anstieg der Remote-Arbeitsvergütung.

Die Personalbeschaffungsbranche hat ein enges Zeitfenster, um die biometrische Verifizierung einzuführen, bevor Deepfake-gestützter Betrug zur Norm wird und nicht mehr zur Ausnahme. Die Technologie, um synthetische Kandidaten zu besiegen, existiert heute – passive Lebenderkennung, aktive Herausforderungen, Gesichtsanpassung an verifizierte Dokumente, 512-dimensionale Gesichtsembedingungen, die kein Deepfake replizieren kann.

Die Frage ist nicht, ob Unternehmen die biometrische Identitätsprüfung in ihren Einstellungsprozess integrieren werden. Es ist, ob sie dies tun, bevor sie ihren eigenen KnowBe4-Moment erleben.

are you ready for free kyc.png

Infrastruktur für Identität und Betrugsprävention.

Eine API für KYC, KYB, Transaktionsüberwachung und Wallet-Screening. In 5 Minuten integriert.

Lass dir diese Seite von einer KI zusammenfassen
Gefälschte Bewerber: KI-Betrug & Erkennung.