Nächtliche Selbstverifikation
Erkennungsrate jede Nacht nachgewiesen. Nicht angenommen.
Early Access. Sanktionslisten können von den ausstellenden Behörden geändert werden.
Die Anforderung
Vollständige Erkennungsrate bei exakten Namensübereinstimmungen. Kein Ziel — eine Anforderung.
Ein Screening-System muss beweisen, dass es funktioniert — nicht einfach Ergebnisse liefern und hoffen. Der Standard ist eindeutig: Wenn eine designierte Person nicht unter ihrem offiziellen Namen gefunden werden kann, hat das System versagt.
Es gibt keinen akzeptablen Schwellenwert unterhalb von vollständig bei exakten Namensübereinstimmungen. Alles darunter bedeutet, dass ein sanktionierter Akteur in Ihren Daten auftauchen und unentdeckt bleiben kann. Die nächtliche Selbstverifikation setzt diesen Standard automatisch durch.
Testdesign
Neun Quellen × ca. 22 Sitzungen pro Quelle = ca. 196 Sitzungen pro Nacht.
Jede Entity aus jeder aktiven Quelle wird unter mehreren Bedingungen gegen sich selbst gescreent. Der Test ist keine Stichprobe — er ist vollständig. Jede Entity. Jede Nacht.
Konfigurationen und Mutationsstufen
Konfigurationen
- Baseline: Vollständige Daten — Name, Entity-Typ, Geburtsdatum, Nationalität. Testet das System unter idealen Bedingungen.
- Ohne Entity-Typ: Testet die Robustheit, wenn der Typ unbekannt ist — ein häufiges Praxisszenario beim Screening unstrukturierter Daten.
- Ohne tertiäre Daten: Testet die Matching-Stärke nur anhand des Namens. Die Baseline für jedes System, das einen Namen ohne biografischen Kontext erhält.
- Produktionsmodus: Bewertet Ergebnisse mit den produktionsnahen Schwellenwerten zur Geburtsdatum-Nacherkennung neu. Testet, ob Einträge, die den Schwellenwert in der Baseline knapp verfehlen, durch den Nacherkennungsdurchlauf des Live-Screenings wiedergefunden werden.
- Ohne maschinelles Lernen: Deaktiviert das maschinelle Lernen vollständig. Isoliert die Leistung der heuristischen Bewertungskette — die Mindestbewertung ohne ML-Unterstützung.
- Quellenübergreifende Validierung (läuft als separate Sitzung, nicht Teil der Konfigurationen A–E): Prüft die Einträge jeder Quelle gegen alle anderen Quellen gleichzeitig. Testet, ob ein Listeneintrag einer Behörde über den Eintrag einer anderen Behörde für denselben Akteur erkennbar ist.
Mutationsstufen:
- M0 — Unverändert: Originalname, wie er auf der Liste erscheint. Muss vollständige Erkennungsrate erreichen. Jeder Fehlschlag bei M0 ist ein kritischer Fehler.
- M1 — Eine Mutation: Zufälliger Zeichentausch, Auslassung, Einfügung, Ersetzung, Diakritikaänderung oder Transliteration. Modelliert einen einzelnen Transkriptionsfehler oder eine abweichende Schreibweise.
- M2 — Zwei Mutationen: Zwei Mutationen gleichzeitig angewendet. Testet die Degradationskurve — wie schnell die Erkennungsrate fällt, wenn die Eingabequalität sinkt.
- M3 — Name Reorder: Token-Reihenfolge wird umgekehrt oder erste und letzte Token werden vertauscht. Testet die Robustheit bei Umordnung von Namensbestandteilen — eine häufige Variante, wenn Namen kulturelle Konventionen kreuzen (Vorname zuerst vs. Nachname zuerst).
- M4 — Partial Name: Nur das erste oder letzte Token wird beibehalten, simuliert unvollständige Namenseingabe. Testet, ob das System einen Kandidaten noch finden kann, wenn nur ein Fragment des vollständigen Namens vorliegt.
Jede Mutation wird deterministisch geseedet. Jeder False Negative ist rückverfolgbar bis zur exakten Mutation, die ihn verursacht hat.
Was wird gemessen
Fünf Metriken pro Sitzung. Jedes falsch-negative Ergebnis wird analysiert, nicht nur gezählt.
Das Ergebnis jeder Verifizierungssitzung ist ein strukturierter Datensatz — kein Pass/Fail-Flag. Jede Metrik wird für die Trendanalyse gespeichert.
Pro Sitzung erfasste Metriken
- Erkennungsrate (Detection Rate): Anteil der Einträge, die in ihren eigenen Screening-Ergebnissen auftauchen. Die zentrale Messgröße. M0-Erkennungsrate muss 100 % betragen. Eine separate Wrong Match Rate (WMR) erfasst, wie oft eine andere Entity auf Platz 1 steht.
- Mittlerer reziproker Rang: An welcher Position erscheint der Eintrag in seinen eigenen fünf besten Ergebnissen? Rang 1 ist ideal. Rang 2 oder niedriger zeigt ein Problem an.
- Bewertungsverteilung: Mittelwert, Median und Perzentile über alle Sitzungen hinweg. Erkennt schleichende Abweichungen — einen allmählichen Bewertungsrückgang, der Erkennungsausfällen vorausgeht.
- Analyse nicht erkannter Einträge: Jeder übersehene Eintrag wird mit der exakten Mutation und dem tatsächlich zurückgegebenen besten Ergebnis protokolliert. Macht Fehlermuster sichtbar und nachvollziehbar.
- Wilson-Konfidenzintervalle: Statistische Grenzen für die True Positive Rate bei 95 % Konfidenz. Verhindert überhöhte Zuverlässigkeitsangaben bei kleinen Quellengrößen.
Die Ergebnisse werden nach jedem nächtlichen Zyklus als strukturierter XLSX-Bericht exportiert.
Was die Ergebnisse bedeuten
Die Erkennungsrate bei exakten Namen (M0) ist vollständig. Bei M1 über 99,9 %, bei M2 über 99 % — und der Bericht zeigt exakt, was nicht erkannt wird.
M0 — Exakter Name (100,0 %): Jeder Eintrag, über alle Quellen hinweg, ist anhand seines offiziellen Namens auffindbar — jede Nacht. Ohne Ausnahme. Jeder Fehlschlag bei M0 ist ein kritischer Fehler und löst sofort einen Alarm aus.
M1 — Eine Mutation (>99,9 %): Ein einzelner Zeichenfehler — ein Tippfehler, eine Vertauschung, eine phonetische Variante. Beispiel: Sergei Ivanov → Sergei Ivanvo (zwei benachbarte Zeichen vertauscht). Die Erkennungsrate misst, ob die richtige Entity in den Ergebnissen auftaucht — nicht nur auf Platz 1. Die wenigen False Negatives konzentrieren sich auf ultrakurze Kennungen (2–3-Zeichen-Schiffscodes, Wallet-Adressen), bei denen eine einzige Mutation den Großteil des Namens zerstört.
M2 — Zwei Mutationen (>99 %): Zwei gleichzeitige Fehler verstärken sich. Beispiel: Hassan Nasrallah → Hassam Nasralah (Nachbartaste + Zeichen gelöscht). Die verbleibenden False Negatives konzentrieren sich auf kurze Kennungen, bei denen zwei Mutationen zu wenig Struktur für eine Wiedererkennung lassen.
Lade aktuelle Ergebnisse…
Sanktionsprüfung — Für Audits konzipiert.
Der Early-Access-Zugang ist kostenlos und umfasst die vollständige Screening-Funktionalität für alle offiziellen Quellen, den kompletten Prüfprozess und audit-fertige Exporte.
Anmelden / Registrieren