Wie Human-in-the-Loop KI-gestützte Schwärzung verbessert

In regulierten Branchen – etwa im öffentlichen Sektor, in Finanzdienstleistungen, Versicherungen oder im Gesundheitswesen – ist eine vollständig automatisierte Schwärzung mit erhöhten Risiken verbunden. Entscheidungen zur Schwärzung erfordern Urteilsvermögen, Kontextverständnis und Verantwortlichkeit. Während KI bei den ersten beiden Punkten häufig an ihre Grenzen stößt, kann sie keine Verantwortlichkeit gewährleisten. Der Einsatz von KI kann die Erkennung personenbezogener Daten deutlich beschleunigen. Dennoch fehlt es KI-Systemen häufig an der notwendigen Präzision und dem kontextuellen Verständnis, um in jeder Situation die richtige Entscheidung zu treffen.

Für einen vollständig konformen Workflow muss sichergestellt sein, dass keine Inhalte ohne explizite menschliche Freigabe entfernt oder beibehalten werden. Dies wird erreicht, indem die Erkennung von der tatsächlichen Schwärzung getrennt und jede Schwärzungsentscheidung durch eine menschliche Prüfung bestätigt wird. Genau hier setzen Human-in-the-Loop-(HITL)-Workflows an.

Durch die Integration von Human-in-the-Loop in Ihren KI-Workflow kombinieren Sie die Vorteile beider Ansätze:

KI-basierte Vorschläge steigern die Effizienz und reduzieren das Risiko menschlicher Fehler im Vergleich zu einer rein manuellen Prüfung
HITL stellt einen integrierten Prüfprozess bereit, der nachvollziehbar macht, wer welches Dokument geschwärzt hat, und schafft damit eine verlässliche Grundlage für Compliance und Audits

Manuelle Schwärzung ist zeitaufwendig und fehleranfällig, insbesondere bei langen oder unstrukturierten Dokumenten. Durch den Einsatz von KI können Prüfer Muster validieren, anstatt jede einzelne Zeile lesen oder große Textmengen überfliegen zu müssen.

Beispiel: Enthält ein Dokument mehrere Namen und Schadensnummern und erkennt die KI alle Schadensnummern, übersieht jedoch einen Namen, kann der Prüfer das zugrunde liegende Muster sofort erkennen und die fehlende Schwärzung ergänzen.

Wie sieht „Human-in-the-Loop“ aus?

Im Zusammenhang mit maschinellem Lernen bedeutet HITL, dass menschliche Kontrolle bewusst an bestimmten Kontrollpunkten in einen Workflow integriert wurde. Es ist der Unterschied zwischen einem KI-Agenten, der eine E-Mail „liest“, eine Antwort verfasst und diese automatisch versendet, und einem Agenten, der vor dem Versenden der E-Mail Ihre Zustimmung einholt. Indem Sie bewusst entscheiden, wo und wie HITL in Ihre KI-Prozesse integriert wird, können Sie die Vorteile der Automatisierung nutzen, ohne die Risiken (und Kosten) einer durchgängigen Automatisierung in Kauf nehmen zu müssen.

HITL-Schritte können in jedem Fall zu KI-Workflows hinzugefügt werden (d. h., jede endgültige Entscheidung muss von einem Menschen genehmigt werden) oder auf der Grundlage von Wenn-Dann-Regeln. Wenn beispielsweise der Confidence-Score unter 95 % liegt, ist eine menschliche Genehmigung erforderlich, bevor der Workflow fortgesetzt werden kann. Oder anstatt einen festgelegten Confidence-Score zu haben, fällt eine Aufgabe vielleicht außerhalb eines anderen vordefinierten Schwellenwerts, wie z. B. die Notwendigkeit einer Genehmigung für eine Kundenrückerstattung über einem bestimmten Limit. Speziell bei Workflows zur Schwärzung sollte jede endgültige Entscheidung von einer Person getroffen werden, insbesondere wenn Compliance-Aspekte eine Rolle spielen.

Der Business Case für HITL-Workflows ist einfach: Sie können einen insgesamt effizienteren Workflow schaffen und gleichzeitig die Wahrscheinlichkeit kostspieliger oder zeitaufwändiger Fehler minimieren. Dieser Ansatz schafft zudem einen nachvollziehbaren Audit-Trail, der zeigt, welcher Mensch welche Schwärzungen wann genehmigt hat. Ein aktueller Bericht hat gezeigt, dass 33 % der befragten Risiko- und Compliance-Experten regulatorische Unsicherheit oder Compliance-Risiken als Hindernis für die Einführung von KI in ihren Unternehmen betrachteten. Die Einbindung von HITL in Ihre KI-Schwärzungs-Workflows ist der effektivste Weg, diese Bedenken auszuräumen und die Akzeptanz in Ihrem Unternehmen zu fördern.

Brauchen wir wirklich »Human-in-the-Loop«?

Vielleicht fragen Sie sich, warum Sie nicht gleich voll auf KI setzen. Sie machen sich bereits die Mühe, Zustimmung für KI zu gewinnen und sie in die Workflows Ihres Unternehmens zu integrieren. Bei sensiblen Aufgaben wie der Schwärzung ist HITL jedoch kein Kompromiss – damit vereinen Sie das Beste aus beiden Welten. Hier sind drei Gründe:

Schwärzung geht über Musterabgleich hinaus. Ein KI-Tool erkennt personenbezogene Daten zwar präzise, doch Sie entscheiden, ob Sie eine Information entfernen. Je nach Dokument und Zweck kann ein Datum, ein Arztname oder ein Medikament harmlos sein oder hohe Sensibilität besitzen. Nur ein menschlicher Prüfer erkennt Absicht, Risiko und Richtlinien.Vollautomatische Schwärzung ist unsicher. Je nach Modell übersieht es Informationen oder erfindet Details.

Unser KI-Redaktions-Tool AI Smart Redact setzt auf NER, um Informationen zu erkennen und zu sortieren. Im Gegensatz zu LLMs, die neuen Text generieren und dabei halluzinieren können, klassifiziert NER nur Entitäten und erfindet nichts. Trotzdem kann es sensible Daten übersehen oder harmlose Angaben fälschlich markieren. »Georgia« kann eine Person, ein Land oder einen Bundesstaat bezeichnen. NER stolpert über solche Begriffe, weil sie je nach Kontext eine andere Bedeutung haben. Auch eine Beschreibung wie »die Stationsleitung« kann ein KI-Tool leicht übersehen. Solche Beispiele zeigen, dass eine vollautomatische Schwärzung im besten Fall chaotisch und im schlimmsten Fall katastrophal ist.

Dokumentformate unterscheiden sich von Branche zu Branche. Ein Anbieter medizinischer Schulungen muss andere Informationen schwärzen und bearbeitet Dokumente anders als eine Versicherungsgesellschaft. Auch innerhalb einer Versicherung variiert die Arbeit: Bei einem Schadenfall prüfen Mitarbeiter Polizeiberichte, Krankenakten und Reparaturkostenvoranschläge.
Wer erwartet, dass ein einziges automatisiertes Tool Dokumente in vielen Formaten fehlerfrei schwärzt, riskiert Probleme. Ein übersehenes Detail genügt, um eine Datenschutzverletzung auszulösen. Treten Fehler auf, schützt die Aussage »die Konfidenzschwelle lag bei über 95 %« nicht vor Bußgeldern. Die Aufsichtsbehörden verlangen eine vertretbare menschliche Zuordnung. Ein Confidence-Score – selbst einer von 99 % – bietet diese nicht.

Letztlich sollte KI unterstützen, nicht autonom handeln. Dokumentenprüfende benötigen keine Blackbox für automatische Schwärzung. Sie brauchen ein System, das erkennt, welche Wörter, Phrasen oder Zahlen sie wahrscheinlich schwärzen sollten. Es zeigt sie zur schnellen manuellen Überprüfung an und führt niemals irreversible Aktionen ohne menschliche Genehmigung aus.

Der ideale HITL-Workflow zur Schwärzung

Der ideale Workflow zur Schwärzung umfasst drei klar getrennte Phasen:

Identifizieren: Das KI-Tool erkennt alle potenziellen Schwärzungskandidaten, ohne die Datei zu verändern. Es orientiert sich dabei an vorab festgelegten Parametern. So deckt der Prozess mehr relevante Stellen ab, spart Zeit bei der manuellen Suche nach personenbezogenen Daten und senkt das Risiko menschlicher Fehler.
Entscheiden: Hier kommt HITL ins Spiel. Eine Person genehmigt, bearbeitet oder lehnt die vorgeschlagenen Schwärzungen ab und fügt bei Bedarf weitere hinzu. Durch diesen eigenen Schritt konzentriert sich die verantwortliche Person ausschließlich auf Richtlinien und ihr Urteilsvermögen. Das KI-Tool beschleunigt die Erkennung, die Verantwortung bleibt bei Menschen.
Schwärzen: Schwärze die Daten deterministisch und protokolliere jeden Schritt revisionssicher.

In diesem Workflow ist HITL eine Voraussetzung für die Aufrechterhaltung der Integrität des Schwärzungsprozesses – es ist nicht nur ein Sicherheitsnetz für Ihr KI-Tool.

Unabhängig davon, wie Ihr Schwärzungs-Workflow aussieht, muss er einer genauen Prüfung standhalten. Ein externer Beobachter muss in der Lage sein, Aufzeichnungen zu überprüfen, die dokumentieren, wer welche Schwärzungen an welchem Datum genehmigt hat und warum die Informationen geschwärzt wurden.

Pflicht-Audit-Trails und deterministische Workflow-Zustände in konformen Organisationen zeigen klar: Menschliche Aufsicht bleibt notwendig.

Vorschriften verlangen, dass jemand für bestimmte Handlungen (oder deren Unterlassung) Verantwortung übernimmt und erklärt, welcher spezifische Teil des Prozesses versagt hat. Das kann ein KI-Agent nicht leisten.

Nach jahrzehntelanger Zusammenarbeit mit Kunden in stark regulierten Branchen zur Optimierung ihrer Dokumenten-Workflows wissen wir, dass eine KI-basierte Schwärzung auf Unternehmensniveau folgende Eigenschaften aufweisen sollte:

Deterministisch: Bei der Schwärzung von Dokumenten ist es entscheidend, bei gleichen Eingaben jedes Mal die gleichen Ergebnisse zu erzielen. Menschen sollten die Parameter festlegen, welche personenbezogenen Daten geschwärzt werden sollen, anstatt dies einer generischen Engine zu überlassen.
Zustandsbehaftet: In stark regulierten Branchen ist der Zugriff auf eindeutige Aufzeichnungen für Compliance-Zwecke und mögliche Audits von entscheidender Bedeutung.
Überprüfung vorrangig: Bevor irgendwelche Änderungen umgesetzt werden, ist eine Überprüfung durch Menschen erforderlich.

Die Einbindung von HITL in Ihre KI-Workflows stellt keinen Engpass dar. Es ist der einzige Weg, KI-gesteuerte Schwärzung einzusetzen und dennoch die volle Kontrolle zu behalten, die Compliance zu wahren und der Sicherheit Vorrang zu geben. Es löst das Problem, über überprüfbare Aufzeichnungen zu verfügen, ohne sich in vollständig manuellen Prozessen zu verzetteln. Indem die KI den Erkennungsprozess beschleunigt und Menschen einbezogen werden, um den Kontext zu überprüfen, bei Bedarf Korrekturen vorzunehmen und die Verantwortlichkeit sicherzustellen, erhalten Sie wirklich das Beste aus beiden Welten.

Wenn Sie mehr über die Erstellung sicherer Schwärzungsprozesse erfahren möchten, lesen Sie unseren Leitfaden zu den verborgenen Ebenen der PDF-Schwärzung… und wenn Sie mit der Umsetzung der darin enthaltenen Tipps beginnen möchten, tragen Sie sich unbedingt in die Early-Access-Liste für AI Smart Redact ein.

Wie Human-in-the-Loop die KI-gestützte Schwärzung verbessert

Wie sieht „Human-in-the-Loop“ aus?

Brauchen wir wirklich »Human-in-the-Loop«?

Der ideale HITL-Workflow zur Schwärzung