Konvertieren von gescannten Dokumenten in PDF/A
Text-/Barcode-Erkennung | Komprimierung | Einbetten von Metadaten | PDF/A-Erstellung | Digitale Signatur | Validierung
Das Scannen von Papierdokumenten im Posteingangsbereich einer Unternehmung ist zum Alltag geworden. Oft wird diese Leistung von einem Scan-Dienstleister erbracht. In den meisten Fällen werden die gescannten Bilder als TIFF-Dateien in Schwarz und Weiss erzeugt, so wie man dies von den FAX-Maschinen gewohnt ist. In speziellen Anwendungen wie Checks, Fotos für Ausweise usw. wird die Datei in Farbe erzeugt. Allerdings ist man damit sehr zurückhaltend, weil TIFF-Dateien in Farbe sehr gross werden können.
Der PDF/A-Standard hat sich heute in Posteingangs-Anwendungen, vor allem wenn es um das Scannen in Farbe geht, weitgehend durchgesetzt. Allerdings sind die einzelnen Bearbeitungsschritte wie Texterkennung, Kompression und Digitale Signatur in der Regel nicht optimal aufeinander abgestimmt und nicht in einer Lösung integriert. So gibt es beispielsweise Scanner, die bereits PDF/A-Dateien erzeugen und sie auch signieren können. Das nachträgliche Komprimieren bricht jedoch die Signatur und macht sie wertlos.
Die PDF Tools AG bietet für das Erzeugen von PDF/A-Dateien aus gescannten und via FAX empfangenen Bildern eine Lösung an, welche die wichtigsten Anforderungen wie kleine Dateigrösse, Durchsuchbarkeit und eingebettete Metadaten erfüllt. Das folgende Bild zeigt das Prinzip.
Der 3-Heights™ Scan to PDF Server ist ein skalierbarer und weitgehend konfigurierbarer Dienst. Der Dienst ruft für jeden Arbeitsschritt wie Kompression, OCR-Erkennung, Umwandlung in PDF/A usw. ein separates Programm auf. Dieses erhält als Eingabe das Resultat des vorangegangenen Arbeitsschritts und stellt die Ausgabe für den nächsten Arbeitsschritt bereit. Die Verknüpfung der Arbeitsschritte erfolgt über eine Konfigurationsdatei in XML. Diese Architektur erlaubt eine sehr flexible Gestaltung der Arbeitsprozesse des Dienstes und fast beliebige Erweiterungsmöglichkeiten (siehe weiter unten), indem zusätzliche Arbeitsschritte hinzugefügt werden.
Um den Grad der parallelen Verarbeitung zu steigern, können die Dokumente in einzelne Seiten zerlegt und parallel durch die Verarbeitungsstufen geschickt werden, an deren Ende sie wieder zu einem einzigen Dokument zusammengefügt werden. Diese Möglichkeit ermöglicht eine stark verbesserte Auslastung der Computerressourcen (Prozessorkerne, Speicher, Ein- und Ausgabe, OCR-Maschine usw.).
Die KIBAG hat mittels des Signierungs- und Validierungsservices und der Integration des 3-Heights™ Scan to PDF Server die manuelle Dokumenten-Verarbeitung durch eine revisionssichere elektronische Archivierung komplett abgelöst. Der Prozess ist dadurch besser kontrollierbar und kann effizienter gestaltet werden. Durch die Automatisierung des Prozesses konnte der manuelle Aufwand signifikant reduziert werden, so dass nun mehr Kapazität für die Bearbeitung anderer dringender Aufgaben zur Verfügung steht.
Alle diese Vorteile lassen sich mit TIFF-Dokumenten grundsätzlich auch realisieren, jedoch nur als proprietäre Erweiterungen, da der TIFF-Standard selbst dafür keine Lösungen bereithält.
Anforderung | TIFF | PDF/A |
---|---|---|
Langfristige Lesbarkeit | + | + |
Eindeutige Wiedergabe | + | + |
Datenkonsistenz | Proprietäre Tags für Metadaten | + |
Authentizität / Integrität | Mit abgesetzten Signaturen | + |
Speicherplatzbedarf | Schwarz / Weiss: + Farbe: - | + |
Durchsuchbarkeit | Proprietäre Tags für OCR Text | + |
Langezeiterfahrung | + | + |
Die einzelnen Bearbeitungsschritte wie Texterkennung, Kompression, PDF/A-Erzeugung und digitale Signatur können in der Regel nicht durch den Scanner alleine ausgeführt werden, weil oft nachträglich Metadaten von einer Index-Station hinzugefügt werden. Dieser Arbeitsschritt bricht jedoch das Siegel der digitalen Signatur und macht sie wertlos. Auch für diesen Aspekt bietet eine separate Software einen entscheidenden Vorteil.