Optimieren Sie Ihre Schadenbearbeitungspipeline mithilfe strukturierter Schlüssel-Wert-Extraktion

Key Value Extraction Illustration

Legt eine Schadensakte auf Ihrem Schreibtisch, begegnen Ihnen sofort viele verschiedene Dateitypen und -formate. Die aktuelle Akte enthält eine gescannte ACORD-Datei, einen per Fax übermittelten Reparaturkostenvoranschlag, Screenshots von E-Mails und eine handschriftliche Schadensbeschreibung. Selbst nach der Erfassung durch Ihr OCR-System bleibt viel manuelle Nacharbeit. Ordnen Sie die Versicherungsnummern den jeweiligen Ereignissen zu. Kennzeichnen Sie die Beträge als medizinische Kosten, Reparaturkosten oder Seriennummern.

Herkömmliche OCR- und RPA-Prozesse verarbeiten strukturierte Dokumente mit festem Layout. Treten jedoch variable Layouts, gemischte Formate oder die nötige kontextbezogene Interpretation auf, sinkt ihre Effektivität – etwa bei Schadensakten. Etwa 80 % aller Unternehmensdaten sind unstrukturiert. Sie stecken in E-Mails, Krankenakten und verschiedenen Dokumenten – Versicherungsdaten bilden keine Ausnahme. Teams im Underwriting geben bis zu 40 % ihrer Zeit mit der manuellen Dateneingabe aus. Diese Kombination zeigt: Eine neue Lösung ist nötig. Hier kommt die strukturierte Schlüssel-Wert-Verarbeitung ins Spiel.


Die strukturierte Extraktion von Schlüssel-Wert-Paaren erleichtert den Aufbau zuverlässiger, skalierbarer Schadenbearbeitungspipelines erheblich. Sie ordnet Datenpunkte den relevanten Bezeichnungen zu und versieht sie mit Kontext, wenn sie aus einer PDF-Datei extrahiert werden. So erkennt sie beispielsweise, dass »2026-01-13« ein Datum ist, und kennzeichnet es bei der Extraktion entsprechend. Hier heißt der Schlüssel »date« und der Wert »2026-01-13«, daher »Schlüssel-Wert-Paar-Extraktion«. Diese strukturierte Extraktion geht über die Vorverarbeitung hinaus. Herkömmliche Methoden schaffen das nicht. So automatisieren und optimieren wir auch andere Teile des Workflows zur Schadenbearbeitung.

Wo herkömmliche Extraktion in Schadenbearbeitungsumgebungen versagt

Ein Nachteil traditioneller Dokumentenextraktionsmethoden ist, dass sie sich meist nur auf die optische Zeichenerkennung (OCR) stützen. Bei der OCR wandelt ein Programm Bilder von getipptem/handgeschriebenem Text in maschinell lesbaren Text um. Diese Technik hat ihren Platz in Dokumenten-Workflows, zeigt aber auch Grenzen. Ihr größter Nachteil: Sie strukturiert die Daten nicht wirklich – sie extrahiert nur den Text. Nachgelagerte Schadenbearbeitungssysteme benötigen strukturierte und beschriftete Daten. Der Rohtext reicht daher nicht. So gehen die Zusammenhänge verloren, die die Daten erst relevant machen: welcher Wert zu welcher Feldbezeichnung gehört, welche Position in welcher Tabelle steht, welcher Betrag der Selbstbehalt und welcher die Gesamtsumme des Schadensfalls ist.


Andere Methoden traditioneller Extraktionsprozesse sind Bilderkennung, intelligente Zeichenerkennung (ICR) und native Textextraktion. Jede Methode hat Stärken und Schwächen. Meist verarbeiten sie ein Format gut, scheitern aber an anderen. Extrahieren Ihre Tools relevante Daten zwar fehlerfrei aus einem Bild, nicht aber aus einer Excel-Tabelle, bleibt viel manuelle Arbeit beim Bearbeiten des Antragsdossiers.

Zwischen »Text auf einer Seite« und »Daten im richtigen Feld« liegt ein großer Unterschied. An dieser Stelle scheitern viele Automatisierungsvorhaben. Nachfolgend finden Sie Beispiele, wo herkömmliche Extraktionsmethoden häufig versagen:

  • Wenn Bezeichnungen von Werten getrennt werden, geht der Kontext verloren und der Prozess bricht ab. Läuft ein gescanntes ACORD-Formular durch die OCR-Verarbeitung, steht die Bezeichnung »Claimant Name« oft drei Zeilen über dem eigentlichen Namen. Kontrollkästchen für »Accident« vs. »Theft« verlieren ihre boolesche Bedeutung. Die Tabellenspalten für Rechnungsbetrag, genehmigten Betrag und gezahlten Betrag fasst das System häufig zu einer einzigen ungeordneten Liste zusammen. Zurück bleibt ein unstrukturierter Rohtext, der sich weder automatisiert weiterleiten noch für die Schadenbearbeitung nutzen lässt.

  • Wenn der Kontext verloren geht, können Sie Dokumente über den gesamten Schadenlebenszyklus hinweg nicht miteinander in Beziehung setzen. Ein vollständiger Schadenfall erfordert den Abgleich von Daten aus verschiedenen Quellen zu unterschiedlichen Zeitpunkten, von der ersten Schadensmeldung (FNOL) über medizinische Unterlagen bis hin zu Gutachten der Schadenregulierer. Das Schadenbearbeitungssystem muss all diese Informationen abgleichen, validieren und abstimmen. Die Versicherungsnummer aus der ersten Schadensmeldung muss mit dem Versicherungsdatensatz übereinstimmen. Der geltend gemachte Betrag muss mit den Einzelposten des Reparaturkostenvoranschlags abgeglichen werden. Ein automatisiertes System schafft das nicht, wenn es nur Rohtext ohne Kontext erhält.

  • Gelangen diese kontextlosen Daten in nachgelagerte Systeme, kämpfen diese um die Verarbeitung. Ob Schadenmanagement-Plattform, Betrugserkennungsmodell, aufsichtsrechtliches Berichtswesen oder KI-gesteuerte Triage-Engine: Nachgelagerte Systeme erwarten Daten in spezifischen Schemata. Schadenbeträge müssen numerisch sein. Datumsangaben benötigen das ISO-Format. Die Versicherungsnummer muss als richtige Zeichenfolge im richtigen Feld stehen. Rohes OCR-Ausgangsmaterial erfüllt diese Anforderungen nicht. Fügen Sie deshalb eine strukturierte Ebene hinzu, die die extrahierten Inhalte eindeutig einem Schema zuordnet und sie anhand Ihrer unternehmensspezifischen Regeln validiert.

So funktioniert die strukturierte Extraktion von Schlüssel-Wert-Paaren

Nach der ersten Schadensmeldung (FNOL) meldet der Versicherungsnehmer einen Schaden. Als Nächstes überprüft und validiert das Versicherungsunternehmen die Angaben anhand der vom Versicherungsnehmer eingereichten Dokumente sowie aller relevanten internen Unterlagen wie der Police. Die strukturierte Extraktion von Schlüssel-Wert-Paaren optimiert diesen Prozess. Sie stellt in jeder Phase des Schadenbearbeitungsprozesses korrekte Daten bereit. Sie löst die genannten Probleme herkömmlicher Extraktionsmethoden, indem sie Beziehungen zwischen verschiedenen Datenpunkten rekonstruiert. Sie verknüpft »Policy Number« mit der richtigen Zeichenfolge. Sie ordnet »Date of Loss« einem ISO-Datum zu. Sie verknüpft Abrechnungscodes mit den entsprechenden Beträgen und ordnet die Auswahl von Kontrollkästchen booleschen Feldern zu.


Das Ergebnis ist sauber und schema-konform (verfügbar als JSON oder XML). Schadenbearbeitungssysteme, Betrugserkennungsmodelle und Compliance-Engines verarbeiten es ohne manuellen Eingriff. Ein gescanntes ACORD-Formular liefert nach Standard-OCR-Verarbeitung zum Beispiel folgende Ausgabe:


»Claimant Name John Smith Date of Loss 11032024 Accident Theft Policy ABC12345 Amount Billed 4200,00 Allowed 3800,00 Paid 3500,00«

Das gleiche Dokument, das mittels strukturierter Schlüssel-Wert-Paar-Extraktion verarbeitet wurde, würde folgendes Ergebnis liefern:

{

"claimant_name": "John Smith",

"date_of_loss": "03.11.2024",

"claim_type": "accident",

"policy_number": "ABC-12345",

"Rechnungsbetrag": 4.200,00,

"genehmigter_Betrag": 3.800,00,

"gezahlter_Betrag": 3.500,00

}


Die erste Version müssen Fachkräfte erst aufbereiten, bevor nachgelagerte Systeme sie verarbeiten können. Die zweite Version ist sofort maschinenlesbar und einsatzbereit. So lösen wir zwei Probleme zugleich:

  1. Sie versorgt KI-/LLM-Tools mit semantisch kohärenten, gekennzeichneten Eingaben. So ermöglichen sie eine intelligente Schaden-Triage und unterstützen Entscheidungen.

  2. Sie liefert deterministische strukturierte Daten für automatisierte Pipelines, die vorhersehbare, validierte Ergebnisse in großem Maßstab benötigen.

Außerdem löst diese Form der strukturierten Extraktion weitere Probleme traditioneller Verfahren:

  • Sie meistert Layout-Varianten zwischen Anbietern und Formularversionen. Allein ACORD-Formulare existieren in Dutzenden von Versionen, und jeder medizinische Dienstleister, jede Reparaturwerkstatt und jede Anwaltskanzlei nutzt eigene Layouts für Kostenvoranschläge, Gutachten und mehr. Ein vorlagenbasierter Ansatz erfordert ständige Neukonfiguration. Die strukturierte Extraktion interpretiert das Layout semantisch statt positionell und skaliert daher mühelos.

  • Sie erkennt Handschrift und beschädigte Dokumente besser. Herkömmliche Verfahren scheitern oft an gemischten Textarten – getippt/handschriftlich – oder an gefaxten, älteren Dokumenten mit Störungen. Genau das ist kritisch, denn solche Unterlagen enthalten handschriftliche Schadensbeschreibungen oder Notizen des Gutachters zur Genehmigung.

  • Korreliert mehrere Dokumente über den gesamten Schadenabwicklungszyklus. Denken Sie an den zuvor erwähnten Kontextverlust. Die strukturierte Extraktion von Schlüssel-Wert-Paaren löst dieses Problem. Sie verhindert nachgelagerte Komplikationen, die entstehen, wenn ein System Rohtext erhält, obwohl es Querverweise und Konsistenz benötigt.Verarbeitet vordefinierte Schemata. Strukturierte Extraktionstools prüfen jedes Dokument anhand eines erwarteten Schemas.

  • Beispielsweise erkennen sie, dass »DOL« für »Date of Loss« (Schadensdatum) steht, dass die Spalte mit Zahlen unter »Amount Billed« (Rechnungsbetrag) Währungswerte enthält und dass ein angekreuztes Kästchen einen booleschen Schadenstyp angibt. So wandeln Sie visuelle Dokumente in datenbankfähige Datensätze um. Zudem erstellt die Extraktion einen Audit-Trail zu einem bestimmten Schadenfall und sorgt dafür, dass Ihr Unternehmen die Compliance-Vorgaben einhält.


Es ist wichtig zu verstehen, dass strukturierte Extraktion nicht «nur» eine Vorverarbeitung ist. Sie bildet die Grundlage für KI-gesteuerte Schadenbearbeitung, Betrugserkennung, Compliance-Berichterstattung und Straight-Through-Processing (STP). Im globalen Gallager Bassett 2025 Claims Insights-Bericht gaben 47 % der Befragten an, dass sie ihre Schadenbearbeitungsprozesse stärken wollen, um auf die sich verändernde Marktdynamik zu reagieren. Die strukturierte Extraktion ist dafür ein besonders effektiver Weg.

KI-Extraktion ist keine generative KI (und dieser Unterschied ist wichtig)

Wenn Sie schon einmal erlebt haben, wie generative KI »halluziniert«, oder sich dieser Möglichkeit überhaupt bewusst sind, sind Sie zu Recht vorsichtig, wenn es darum geht, KI-Tools in Schaden-Workflows einzuführen. Das ist eine berechtigte Sorge, insbesondere wenn personenbezogene Daten im Spiel sind – sie beruht allerdings auf einer Verwechslung der Kategorien.


KI-gestützte Extraktion ist nicht generativ, denn sie erzeugt keine Inhalte. Sie erkennt und strukturiert vorhandene Informationen anhand eines vordefinierten Schemas. Die Ergebnisse sind deterministisch und lassen sich anhand von Geschäftsregeln validieren. Bei der Einführung von KI in Workflows sollten Sie umsichtig vorgehen. Definieren Sie klare Richtlinien und Sicherheitsvorkehrungen für den Fall von Fehlern, einschließlich Human-in-the-Loop. Passen Sie die Art der KI an die jeweilige Aufgabe an.


Nutzen Sie LLMs für andere Zwecke, verbessert die KI-Extraktion den Datensatz, mit dem Ihre LLMs arbeiten. Präsentieren Sie saubere, geordnete Daten in strukturierten Schlüssel-Wert-Paaren statt in loser Ansammlung von Text und Bildern. Trainieren Sie das Modell so mit hochwertigen Daten und erzielen Sie bessere Ergebnisse.

Die Folgewirkungen: Was eine stabile Extraktion ermöglicht

Strukturierte Schlüssel-Wert-Paare zu extrahieren bringt viele unmittelbare Vorteile: Sie verarbeiten unterschiedliche Dokumentformate und Layouts flexibler und erkennen handschriftliche Inhalte präziser. Außerdem erhalten Sie direkt datenbankfähige Informationen. Darüber hinaus sprechen weitere Gründe für diese Extraktionsmethode:

  • Mit den extrahierten Daten laufen Prozesse durchgängig. Das System bearbeitet einfache Ansprüche Ende-zu-Ende automatisch und gibt Mitarbeitern Zeit für komplexe Fälle.

  • Hochwertige Daten trainieren LLMs zuverlässiger und senken Fehler in allen LLM-gesteuerten Abläufen. Viele Versicherer nutzen für die interne Informationsgewinnung RAG (Retrieval-Augmented Generation). Die strukturierte Extraktion von Schlüssel-Wert-Paaren liefert hochwertigere Daten als Rohtext. Diese Daten landen in denselben Wissensdatenbanken, aus denen RAG schöpft. Das System erhält sauberere und strukturiertere Daten und liefert bei Abfragen genauere, fundiertere Antworten.Strukturierte

  • Ausgabeformate steigern die Interoperabilität. JSON, XML oder direkte API-Payloads erleichtern es Schadenbearbeitungssystemen, Analyseplattformen, Compliance-Reporting-Tools und anderer Software, extrahierte Daten konsistent zu verarbeiten. Flachtext-Extraktion kommt bei mehrseitigen Arztrechnungen, sich wiederholenden Einzelposten oder verschachtelten Entitätsbeziehungen schnell an ihre Grenzen. Die strukturierte Ausgabe bewältigt diese Fälle ohne Mühe.


Die Bearbeitung von Schäden kann zeitaufwendig und mühsam sein, doch das muss nicht so bleiben. Fehler im Automatisierungsworkflow entstehen selten bei der KI oder der Technologie selbst. Meist liegt das Problem in der Datenaufnahme. Rohtext-Extraktion aus Schadensdokumenten erfordert dagegen viel manuelle Nacharbeit, bevor Sie die Daten weiterverwenden können. Die strukturierte Extraktion von Schlüssel-Wert-Paaren umgeht dieses Problem. Wenn Versicherungsunternehmen mit Wettbewerbern und wirtschaftlichen Schwankungen Schritt halten wollen, ohne ihren Kundenservice zu senken, bilden solche Pipelines ein zuverlässiges und skalierbares Fundament, das Ressourcen für andere Aufgaben freimacht.

Gefällt Ihnen, was Sie sehen? Teilen Sie es mit einem Freund.