Verwandeln Sie diese Dateien in Pixel!

Die Digitalisierung scheint in diesen Tagen in aller Munde zu sein. Sobald ein Pixel im Spiel ist, fällt dieses beliebte Schlagwort, gefolgt von zahlreichen Namen von Unternehmen, digitalen Philosophen und Datengurus. Aber was genau gewinnen die Unternehmen durch das "Erfassen"?

Vergangenheit und (noch) Gegenwart

Lange vor dem Aufkommen der Digitalisierung wurden Postsendungen geöffnet, sortiert, mit einem Datumsstempel versehen und in den internen Briefkasten des zuständigen Mitarbeiters eingeworfen. Später sichtete diese Person das Dokument, ordnete die Rechnung z. B. einem Konto zu und gab sie in das Buchhaltungssystem ein. Das Dokument wurde dann zur Unterschrift an den Verantwortlichen der jeweiligen Kostenstelle weitergeleitet.

Nach der Genehmigung kam die Rechnung zurück, die Zahlung wurde ausgeführt, und dann wurde der Papierkram in einem dicken Ordner abgelegt, der später in einem Archiv im Keller landete. Die Aktenschränke und Ordner in den Kellerräumen waren bis zur Decke gefüllt, und wenn ein Dokument benötigt wurde, begann die Suche in den Regalen, Akten und Registern. Papier ist zeit- und kostenintensiv. Und wehe dem, der eine Akte oder ein Dokument verlegt hatte! Viele Unternehmen verlassen sich noch immer auf diese alten Praktiken - verstärken aber derzeit ihre Bemühungen um die Digitalisierung.

Digitalisierung während der Erfassung?

Die Digitalisierung kann Unternehmen bei einer Reihe von Prozessen einen Mehrwert bieten. Nehmen Sie zum Beispiel das Schlagwort "Erfassen". Täglich werden wir mit Dokumenten, Daten, E-Mails und anderen Informationen überflutet. Wir erhalten geschäftsrelevante und weniger relevante Informationen über verschiedene Kanäle und in unterschiedlichen Formaten. Digitale Prozesse können diese Daten überwachen, scannen, sortieren, kategorisieren und durch die entsprechenden Verarbeitungsschritte leiten. Das Ziel der Digitalisierung ist es, die nachfolgenden Verarbeitungsschritte bestmöglich zu unterstützen. Doch Maschinen und Algorithmen können nicht jedes Szenario beherrschen.

Um den gesamten Prozess in Gang zu setzen, müssen die eingehenden Dokumente zunächst gescannt werden und eine OCR-Engine muss die notwendigen Informationen erkennen, exportieren und mit dem Dokument verknüpfen. Nur so können zum Beispiel Rechnungen von Lieferanten in den unterschiedlichsten Formaten erkannt und gelesen werden, um die elektronische Zahlungsabwicklung zu unterstützen.

Die optische Zeichenerkennung (OCR) beschleunigt nicht nur den Prozess vom Dokumenteneingang über die Kontierung bis hin zur Zahlung - die gespeicherten Informationen ermöglichen auch das jederzeitige Auffinden von Dokumenten über eine Volltextsuche. Der Ausdruck der Rechnung verschwindet, sobald er gescannt ist, alle notwendigen Daten gespeichert sind, die Zahlung genehmigt und abgeschlossen ist und alles im elektronischen Archiv abgelegt ist. Dies bedeutet nicht nur die Speicherung, sondern auch den Schutz des Dokuments in Bezug auf Zugriff, Zeitstempel und elektronische Signaturen.

Auch die Orte, an denen wir unsere Arbeit verrichten, verändern sich. Dieser Wandel erfordert Flexibilität. Immer mehr Mitarbeiter arbeiten von zu Hause aus, benötigen aber Zugang zu Dokumenten. Nur durch die Digitalisierung können die benötigten Informationen zur Verfügung gestellt werden. Nebenbei bemerkt ist dies auch der Traum eines jeden Clean-Desk-Inspektors, der erwartet, dass die Schreibtische der Arbeitnehmer immer weniger überladen sind. Zum gleichen Zweck gibt es auch Dokumentenprozesse, die wieder aus dem Unternehmen herausführen. Auch hier sind digitalisierte Dokumente in den meisten Fällen deutlich schneller, sicherer und effizienter.

Aber das ist noch nicht alles! Bei Prüfungen ist es nicht mehr notwendig, kistenweise Akten aus dem Keller in einen Besprechungsraum für den Prüfer zu schleppen. Stattdessen werden dem Prüfer einfach die entsprechenden Zugriffsrechte zur Akteneinsicht erteilt und er prüft die Dokumente aus der Ferne im digitalen Archiv. Das spart beiden Parteien eine Menge Zeit und Stress. Sollte dieses Szenario unerwünscht sein, ist es auch möglich, die Dokumente auf einem sicheren USB-Stick für die Übergabe an den Prüfer zu speichern.

Das digitale Schmetterlingsnetz

Die Eingangskanäle für Dokumente sind so vielfältig wie die Palette der Formate und Qualitäten. Was erfasst werden kann, wird erfasst, sowohl in der analogen als auch in der digitalen Welt. Auch im Zeitalter von elektronischen Rechnungen, Online-Shops und E-Commerce hat Papier noch nicht ausgedient: Dokumente wie Rechnungen, Steuerformulare, Dienstleistungsberichte und Verträge werden immer noch häufig in Papierform ausgestellt und auf dem altmodischen Postweg verschickt und empfangen.

Um die gewünschte elektronische Form für den Dokumentenprozess zu erreichen, werden Papierdokumente gescannt. Eine gute Bildqualität ist für eine niedrige Fehlerquote bei der Erkennung unerlässlich. Um eine gute Bildqualität bei einer hohen Komprimierungsrate zu erreichen, ist eine Verarbeitungsleistung erforderlich, über die lokale Multifunktionsdrucker in der Regel nicht verfügen. Normalerweise erzeugt ein Scanner für jede Seite ein TIFF- oder JPEG-Bild. Einige Geräte sind in der Lage, direkt PDF-Dateien zu erstellen, und neuere Geräte erzeugen Dateien, die dem PDF/A-Standard entsprechen. Die Qualität dieser Dateien ist jedoch je nach Anbieter und Konvertierungssoftware sehr unterschiedlich.

Um dieses Qualitätsproblem zu lösen, wird ein zentraler Scan-Server empfohlen. Der Dienst übernimmt alle Aufgaben, die von lokalen Scanstationen delegiert werden können. Dieser Server empfängt die gescannten Bilddateien, analysiert die Dokumente und erzeugt ein PDF/A-Dokument mit allen Text- und Bildinformationen, die auf die richtige Größe komprimiert sind. Das Dokument kann auch mit einem Zeitstempel oder einer digitalen Signatur versehen werden. Die erfassten Informationen liegen nun in einem standardisierten, qualitativ hochwertigen Format vor, das sowohl für menschliche Leser als auch für die automatisierte Verarbeitung mit IT-Anwendungen geeignet ist.

Im Gegensatz dazu gibt es eine Reihe von Digitalherstellern, die elektronische Formate mit unzureichender PDF-Qualität anbieten, was zu unerwarteten Problemen und Kosten bei der Dokumentenverarbeitung führt. Bei der PDF-Konvertierung geht es nicht nur darum, ein Bild in einen PDF-"Umschlag" zu verpacken. Das PDF-Dokument kann Text- und Strichcode-Erkennung, eingebettete Metadaten und digitale Signaturen enthalten.

Die rasante technologische Entwicklung führt dazu, dass heute eingesetzte Systeme schnell veraltet sind und ersetzt werden müssen. Der Inhalt der archivierten Dokumente bleibt jedoch relevant. Daher sollte es möglich sein, sie unverändert in die neuen Systeme zu migrieren. Die Voraussetzung für eine verlustfreie Migration ist ein stabiles Dokumentenformat, das den Lebenszyklus der Systeme überdauert.

Vom Punkt zum Bit

Durch die Erweiterung der Scanfunktion mit Texterkennung (OCR) haben Sie die Möglichkeit, alle Dokumente mit zusätzlichen Informationen anzureichern, was sich positiv auf den gesamten Dokumentenprozess auswirkt. Dokumente, vom gescannten Papier über elektronische Dokumente bis hin zu E-Mails und Anhängen, können anhand von Textattributen, Elementen und der Dokumentenstruktur Abteilungen oder Vorgängen zugeordnet werden.

Das System erkennt, ob es sich bei den Dokumenten beispielsweise um normale Korrespondenz, Bestellungen, Lieferscheine oder Rechnungen handelt und leitet sie entsprechend des Verteilungsschlüssels weiter. Das hilft bei nachgelagerten Prozessen und Entscheidungszyklen sehr.

Eine gute Texterkennung mit Nachbearbeitung unterstützt also nicht nur die Erfassung als solche. Sie ermöglicht es auch, die Klassifizierung und Dokumentenverteilung effizienter zu gestalten - inklusive Nachbearbeitung und verbesserter Überprüfbarkeit und Auffindbarkeit der Dokumente für Compliance-Zwecke. Nach der Informationsanreicherung ermöglicht OCR Stichwortsuchen, Reporting-Funktionen, die Erstellung themenspezifischer Dossiers und beschleunigt damit generell die Reaktionszeit und die Bearbeitung.

Auch wenn die gemeinsame Nutzung elektronischer Dokumente in Geschäftsprozessen bereits zur Selbstverständlichkeit geworden ist, wird die Qualität der Dokumente oft vernachlässigt. In beiden Fällen ist ein Qualitätskontrollsystem für eingehende Dokumente unverzichtbar geworden. Doch bevor man ein so genanntes "Quality Gate" einrichtet, muss man sich über die Definition von Qualität im Klaren sein. Viele Unternehmen haben einen Dokumentenprozess, der mit einem Hauptformat arbeitet. Das vereinfacht den gesamten Prozess und reduziert den Dschungel der verschiedenen Formate in den Kanälen, so dass sich die Prozesse viel besser steuern lassen.

Wenn wir PDF als Standardformat verwenden, ergeben sich zwei Arten von Qualität: inhärente Qualität und dedizierte Qualität. Die inhärente Qualität prüft die Konformität mit der Dateiformatspezifikation (ISO 32000). Denn nicht jedes als PDF gekennzeichnete Dokument ist tatsächlich ein richtiges PDF - zumindest nicht in der Form, die Unternehmen für die Weiterverarbeitung bis hin zum Archiv wünschen.

Die dedizierte Qualität konzentriert sich auf Anwendungsfälle wie Scannen, Dokumentenaustausch, Druck und Archivierung, zum Beispiel darauf, ob Schriftarten und Farben optimiert sind und ob die Dateien bei Bedarf dem PDF/A-Standard für die digitale Langzeitarchivierung genügen. Nach der Erfassung sorgt ein "Quality Gate" für die Validierung, Reparatur, Optimierung und digitale Signierung und damit für den Schutz der Dokumente.

Egal wie einfach oder umfangreich ein Dokumentenprozess auch sein mag, wichtig ist, dass er vor der Einführung gut geplant und getestet wird, und zwar in Bezug auf den Umgang mit externen und internen Dokumenten sowie deren Prüfung, Anreicherung, Verteilung und Archivierung. Dies verbessert die Reaktionszeiten, schont die Ressourcen auf allen Ebenen und ist für die Rückverfolgbarkeit und die Einhaltung der Vorschriften wesentlich transparenter.

Zusammenfassung

Ein zentraler Scan-Server mit optischer Zeichenerkennung (OCR) und ein nachgeschaltetes Quality Gate sind der Schlüssel zu einem reibungslosen digitalen Dokumentenerfassungsprozess. Die Texterkennung ermöglicht es, die aus einem Dokument gewonnenen Informationen zu kanalisieren, Dokumentenprozesse effizient zu gestalten und eine gute Durchsuchbarkeit zu gewährleisten. Das Quality Gate sorgt für gleichbleibende Qualität und Dokumentensicherheit. Die Automatisierung minimiert Fehlerquellen, verbessert die Dokumentenqualität und spart damit Zeit und Geld - vom Eingang der Dokumente bis zu ihrer Langzeitarchivierung.

In einer Welt der Bits und Bytes sollten wir auch den Faktor Mensch nicht vergessen, sei es im Hinblick auf die Benutzerfreundlichkeit oder den Datenschutz. Dabei ist zu beachten, dass eine Sternsoftware allein weder die Akzeptanz bei den Nutzern noch die Transparenz im Hinblick auf gesetzliche Regelungen und Richtlinien gewährleisten kann. Dazu braucht es ein gutes Konzept und Verständnis. Nachvollziehbarkeit ist nicht nur für digitale Akten in einem Archiv relevant, sondern auch für Menschen.

Capturing ist keine Zauberei, sondern vielmehr die rationelle Erfassung, Überprüfung und Anreicherung von Informationen. Aber mit Capturing kann man viel erreichen - also verwandeln Sie diese Dateien in Pixel und sagen Sie Hallo zur Digitalisierung.

Gefällt Ihnen, was Sie sehen? Teilen Sie es mit einem Freund.

Nadine Schuppisser

Geschrieben von Nadine Schuppisser

Nadine Schuppisser ist Leiterin Marketing und Kommunikation der PDF Tools AG. Pdftools bietet PDF & PDF/A Komponenten und Lösungen für die Digitalisierung, den Dokumentenprozess und die rechtssichere Langzeitarchivierung. PDF Tools AG ist der Schweizer Vertreter im ISO-Komitee für PDF/A und PDF und Gründungsmitglied der PDF Association.

Grüezi! Wie können wir helfen?

Telefon