Bilddetektion in gescannten Bildern

Eine gescannte Seite ist ursprünglich ein Rasterbild, das aus zweifarbigen oder farbigen Pixeln besteht. Da wir über ausgeklügelte Kompressionsmethoden verfügen, wird das Scannen in Farbe eindeutig gegenüber reinen Schwarzweißmodi bevorzugt. Eine solche Methode ist die Mischrasterinhalt-Methode (MRC), die das gescannte Bild in eine Hintergrund-, Masken- und Vordergrundschicht trennt. Jede Schicht kann individuell mit speziellen Algorithmen komprimiert werden, die auf ihren spezifischen Zweck parametriert sind. Solche Algorithmen sind JBIG2 für die Maske und JPEG2000 für die Hintergrundschicht.

Es kann mehrere Vordergrundschichten geben, z.B. für Fotografien, die Teil der gescannten Seite sind. Um diese Bilder von der Hintergrund- und Maskenschicht zu trennen, muss ein spezifischer Segmentierungsalgorithmus sie erkennen und isolieren. Jedes dieser Bilder kann jetzt eine individuelle Vordergrundschicht bilden, die mit einem spezifischen Algorithmus wie JPEG komprimiert ist.

Die MRC-Methode für gescannte Seiten kann folgendermaßen durchgeführt werden:

Segmentierungsalgorithmus: Bilder erkennen und isolieren
Trennalgorithmus: Berechnung der Pixel der Bildmaske und des farbigen Hintergrunds.
Komprimiere jede Schicht mit einem speziellen Kompressionsalgorithmus
Setze die Schichten gemäß einem MRC-Schema wie RFC 2301 in TIFF oder als maskiertes Bild in PDF zusammen.

Das Entfernen von Bildern von der gescannten Seite kann auch den Textverarbeitungsprozess (OCR) beschleunigen.

Eine interessantere Funktion kann jedoch angeboten werden. Wenn die genannten Bilder isoliert und einer individuellen Schicht zugewiesen wurden, können sie mit einem geeigneten Tool leicht aus dem Dokument extrahiert werden.

Darüber hinaus kann beim Erstellen eines PDF-Dokuments aus einer gescannten Seite das optionale Inhaltsmerkmal verwendet werden, um die Hintergrund- und Vordergrundschichten ein- und auszuschalten.

Unsere Produkte wie das 3-Heights™ TIFF Toolbox, der 3-Heights™ Scan Server und der 3-Heights™ Optimizer unterstützen jetzt die in diesem Artikel beschriebenen Funktionen. Um die Bilder aus einem PDF-Dokument zu extrahieren, kann das 3-Heights™ PDF Extract-Tool verwendet werden.

PDF Extract

PDF Optimizer

PDF Toolbox SDK

Bilddetektion in gescannten Bildern

Grüezi! Wie können wir helfen?