Anmelden / Registrieren

Warum nicht einfach ein LLM verwenden?

LLMs sind leistungsstark, aber keine Compliance-Engine. Hier ist, warum die Architektur entscheidend ist.

Sanktionslisten können von den ausstellenden Behörden geändert werden.

Die Frage

Warum eine deterministische Bewertungskette bauen, wenn ein KI-Modell einfach antworten könnte?

Die Frage kommt regelmäßig: Warum eine hybride Bewertungskette betreiben — Zeichenkettenmetriken, KI-Modelle, Schwellenwertbänder, Schutzregeln — wenn man Suchnamen und Zieldatensatz einfach einem KI-Modell vorlegen und fragen könnte: „Sind das dieselben Entitäten?“

Drei Gründe: Geschwindigkeit, Revisionssicherheit, Reproduzierbarkeit.

Klarstellung. Diese Seite betrifft die Screening-Engine, die rein deterministisch arbeitet. Einige Zusatzfunktionen nutzen die Anthropic-Claude-API: Chat (Fragen zu Entitäten), Entscheidungs-Zusammenfassung (pro Prüfung) und der ER-Guardian-Audit. Diese sind optional und pro Projekt abschaltbar. Die Sanktionsprüfung selbst hängt nie von einer KI ab.

Kopf-an-Kopf: Hybrid vs. reines LLM

Über die Kriterien, die im Compliance-Betrieb wirklich zählen.

Kriterium Hybrid (heuristisch + ML) Reines LLM
Latenz Millisekunden pro Match Sekunden pro Match
Kosten bei Skalierung Sehr gering – minimaler Rechenaufwand Sehr hoch – API-Kosten pro Token
Auditierbarkeit Vollständig – jede Bewertung ist bis zum genauen Vergleich zurückverfolgbar Schlecht – Argumentation variiert, schwer zu dokumentieren
Reproduzierbarkeit 100 % – gleiche Eingabe, gleiche Ausgabe Variabel – Temperatur und Modellaktualisierungen beeinflussen die Ergebnisse
Regulatorische Akzeptanz Hoch – deterministische Regeln erfüllen die Anforderungen von BaFin, FCA, OFAC Niedrig – Black-Box-Argumentation ist schwer zu verteidigen
Massen-Durchsatz Skalierbar auf große Datensätze ohne API-Ratenbeschränkungen oder Token-Kosten Nicht geeignet für die Überprüfung von Watchlists bei Skalierung
Semantisches Verständnis Beschränkt auf programmierte Features Ausgezeichnet – Weltwissen, semantischer Kontext
Risiko von Halluzinationen Keines – deterministisch Real – ein übersehener Sanktionstreffer ist ein Compliance-Verstoß

Der hybride Ansatz

Deterministische Regeln als Boden, maschinelles Lernen als Obergrenze.

Zeichenkettenmetriken und Schutzregeln bilden den Boden. Modelle für maschinelles Lernen können eine Bewertung nur anheben, nie absenken. Der Grund ist regulatorisch: Wenn die heuristische Bewertungskette „keine Übereinstimmung“ meldet, ist diese Entscheidung mathematisch nachvollziehbar — Zeichen für Zeichen.

Stärken und Einschränkungen

Stärken

  • Regulatorische Vertretbarkeit: BaFin, FCA und OFAC verlangen Erklärbarkeit. Lehnt das System einen Treffer ab, können Sie genau zeigen warum — bis auf den Zeichenvergleich.
  • Massendurchsatz: Banken und Zahlungsabwickler prüfen täglich Millionen Transaktionen in Echtzeit. Zeichenkettenvergleiche kosten Mikrosekunden und skalieren horizontal — ohne externe API, ohne Rate-Limits.
  • Präzise Kontrolle: Taucht ein neues Fehlalarm-Muster auf — etwa ein generisch gewordener Begriff wie „Krypto“ — fügen wir eine Schutzregel hinzu. Sie greift ab der nächsten Prüfung plattformweit.

Einschränkungen

  • Wartungsaufwand: Schwellenwerte und Gewichte müssen laufend gegen einen Ground-Truth-Datensatz geprüft werden. Genau dafür gibt es die nächtliche Selbstverifikation.
  • Kontextblindheit: Benennt sich ein Unternehmen von „Twitter“ in „X“ um, versagt jede String-Metrik. Wir überbrücken das mit Metadaten — LEI und kuratierten Alias-Listen — um vollständige Namensänderungen aufzufangen.

Sanktionsprüfung — für Audits gebaut.

Jede Bewertung nachvollziehbar, jede Entscheidung dokumentiert, keine Black Boxes.

Anmelden / Registrieren