3-Heights™ Scan to PDF Server – Verarbeitung von gescannten Dokumenten nach PDF/A

Das Scannen von Papierdokumenten im Posteingangsbereich einer Unternehmung ist zum Alltag geworden. Oft wird diese Leistung von einem Scan-Dienstleister erbracht. In den meisten Fällen werden die gescannten Bilder als TIFF-Dateien in Schwarz und Weiss erzeugt, so wie man dies von den FAX-Maschinen gewohnt ist. In speziellen Anwendungen wie Checks, Fotos für Ausweise usw. wird die Datei in Farbe erzeugt. Allerdings ist man damit sehr zurückhaltend, weil TIFF-Dateien in Farbe sehr gross werden können.

Der PDF/A-Standard hat sich heute in Posteingangs-Anwendungen, vor allem wenn es um das Scannen in Farbe geht, weitgehend durchgesetzt. Allerdings sind die einzelnen Bearbeitungsschritte wie Texterkennung, Kompression und Digitale Signatur in der Regel nicht optimal aufeinander abgestimmt und nicht in einer Lösung integriert. So gibt es beispielsweise Scanner, die bereits PDF/A-Dateien erzeugen und sie auch signieren können. Das nachträgliche Komprimieren bricht jedoch die Signatur und macht sie wertlos.

Die PDF Tools AG bietet für das Erzeugen von PDF/A-Dateien aus gescannten und via FAX empfangenen Bildern eine Lösung an, welche die wichtigsten Anforderungen wie kleine Dateigrösse, Durchsuchbarkeit und eingebettete Metadaten erfüllt. Das folgende Bild zeigt das Prinzip.

Automatisierung

Dateien aus dem Scan erstellen und signieren

Texterkennung

Gescannte Dokumente durchsuchbar machen (OCR)

Enterprise Anwendung

Zentraler Dienst zur Erstellung von PDF/A-Dokumenten

Produktgrafik 3-Heights™ Scan to PDF Server

Scan to PDF Server - Funktionen

  • Features
    • Umwandlung von Einzel- oder Mehrfachseiten mit Rasterbildern zu PDF
    • Bearbeitung von Unterordnern
    • Flexible Workflow-Konfiguration
    • Setzen des Ausgabeformats und der Konformitätsstufe (PDF, PDF/A-1, PDF/A-2 and PDF/A-3)
    • Optische Zeichenerkennung (OCR) inklusive Barcodes
    • Digitale PDF Signatur
    • Parallele Verarbeitung
  • Komprimierung
    • Individuelle Einstellung der Bildkompression für verschiedene Bildklassen
    • Unterstützung für Mixed-Raster-Content (MRC)
    • CCITT Group3 (1D and 2D)
    • CCITT Group4
    • LZW
    • JPEG
    • Deflate (ZIP)
    • JPEG2000
    • JBIG2 (nur verlustfrei)

Conformance

  • ISO 19005-1 (PDF/A-1)
  • ISO 19005-2 (PDF/A-2)
  • ISO 32000-1 (PDF 1.7)

Unterstützte Formate

Eingabebildformate

  • JPEG
  • TIFF
  • Gescanntes PDF
Vergrößerungslinse für unsere PDF-Handbücher und PDF-Beispielcode

HANDBUCH

Service

 

 

Einsatzgebiete - PDF/A-Dateien aus gescannten Dokumenten erstellen

  • Paper Capture:
    Elektronische Archivierung von Papier-Dokumenten, welche im Posteingang einer Unternehmung anfallen
  • Facsimile Capture:
    Elektronische Archivierung des gesamten FAX-Verkehrs zwischen der Unternehmung und seinen Geschäftspartnern.
  • Archive Migration:
    Migration von Papier-Archiven in ein elektronisches Archiv mit dem standardisierten PDF/A Format.
  • Web / Mobile Capture:
    Nutzung des zentralen Dienstes in Client / Server-Anwendungen über einen Webdienst.
  • Enterprise Application Integration:
    Nutzung des zentralen Dienstes für die PDF/A Dokumentenerzeugung über eine Programmierschnittstelle (API) aus Fachapplikationen heraus, welche TIFF- oder JPEG-Dateien erzeugen.

Verteilte Architektur und Skalierbarkeit

Der 3-Heights™ Scan to PDF Server ist ein skalierbarer und weitgehend konfigurierbarer Dienst. Der Dienst ruft für jeden Arbeitsschritt wie Kompression, OCR-Erkennung, Umwandlung in PDF/A usw. ein separates Programm auf. Dieses erhält als Eingabe das Resultat des vorangegangenen Arbeitsschritts und stellt die Ausgabe für den nächsten Arbeitsschritt bereit. Die Verknüpfung der Arbeitsschritte erfolgt über eine Konfigurationsdatei in XML. Diese Architektur erlaubt eine sehr flexible Gestaltung der Arbeitsprozesse des Dienstes und fast beliebige Erweiterungsmöglichkeiten (siehe weiter unten), indem zusätzliche Arbeitsschritte hinzugefügt werden.

Um den Grad der parallelen Verarbeitung zu steigern, können die Dokumente in einzelne Seiten zerlegt und parallel durch die Verarbeitungsstufen geschickt werden, an deren Ende sie wieder zu einem einzigen Dokument zusammengefügt werden. Diese Möglichkeit ermöglicht eine stark verbesserte Auslastung der Computerressourcen (Prozessorkerne, Speicher, Ein- und Ausgabe, OCR-Maschine usw.).

Revisionssichere Archivierung von Kreditorenrechnungen bei der KIBAG Dienstleistungen AG

Die KIBAG hat mittels des Signierungs- und Validierungsservices und der Integration des 3-Heights™ Scan to PDF Server die manuelle Dokumenten-Verarbeitung durch eine revisionssichere elektronische Archivierung komplett abgelöst. Der Prozess ist dadurch besser kontrollierbar und kann effizienter gestaltet werden. Durch die Automatisierung des Prozesses konnte der manuelle Aufwand signifikant reduziert werden, so dass nun mehr Kapazität für die Bearbeitung anderer dringender Aufgaben zur Verfügung steht.

  • Einheitliches Format:
    PDF/A ist für die Speicherung sowohl von gescannten als auch von digital erzeugten Dokumenten gleichermassen geeignet.
  • Hohe Kompressionsrate:
    Der PDF/A-Standard unterstützt modernere und leistungsfähige Kompressionsverfahren und somit auch kleine Dateigrössen für Farbbilder.
  • Texterkennung: 
    Die erzeugten PDF/A-Dokumente können durch das Einbetten von Texten aus einer OCR-Maschine durchsuchbar gemacht werden.
  • Eingebettete Metadaten:
    Damit das Dokument und die dazugehörenden Metadaten eine unteilbare Einheit bilden, werden in PDF/A die Metadaten in die Datei eingebettet. PDF/A verwendet für die Speicherung das Extensible Metadata Platform (XMP) Format, welches unabhängig von PDF/A als eigener ISO Standard definiert ist.
  • Digitale Signatur:
    Um die Integrität und Authentizität der erzeugten Dokumente zu gewährleisten, kann optional eine digitale Signatur nach dem PAdES-Standard auf das PDF/A-Dokument aufgebracht werden. Die digitale Signatur ist eine Form der elektronischen Signatur, welche dem Erfordernis der handschriftlichen Unterschrift gleich gerecht werden kann, wie die handschriftliche Unterschrift selbst, sofern die gesetzlichen Voraussetzungen (nationale Signaturgesetze) dafür erfüllt sind.

Alle diese Vorteile lassen sich mit TIFF-Dokumenten grundsätzlich auch realisieren, jedoch nur als proprietäre Erweiterungen, da der TIFF-Standard selbst dafür keine Lösungen bereithält.

Illustration 1: Vorteile von PDF/A gegenüber TIFF
AnforderungTIFFPDF/A
Langfristige Lesbarkeit++
Eindeutige Wiedergabe++
DatenkonsistenzProprietäre Tags für Metadaten+
Authentizität / IntegritätMit abgesetzten Signaturen+
SpeicherplatzbedarfSchwarz / Weiss: +
Farbe: -
+
DurchsuchbarkeitProprietäre Tags für OCR Text+
Langezeiterfahrung++

Die einzelnen Bearbeitungsschritte wie Texterkennung, Kompression, PDF/A-Erzeugung und digitale Signatur können in der Regel nicht durch den Scanner alleine ausgeführt werden, weil oft nachträglich Metadaten von einer Index-Station hinzugefügt werden. Dieser Arbeitsschritt bricht jedoch das Siegel der digitalen Signatur und macht sie wertlos. Auch für diesen Aspekt bietet eine separate Software einen entscheidenden Vorteil.