Bilderkennung in gescannten Bildern

Die Erkennung von Bildern in gescannten Dokumentenseiten hat viele Vorteile, wie z. B. bessere Komprimierungsraten und die Möglichkeit, sie einzeln zu extrahieren.

Eine gescannte Seite ist ursprünglich ein Rasterbild, das aus zweistufigen oder farbigen Pixeln besteht. Da wir über ausgefeilte Komprimierungsmethoden verfügen, ist das Scannen in Farbe eindeutig den reinen Schwarz/Weiß-Modi vorzuziehen. Ein solches Verfahren ist das MRC-Verfahren (mixed raster content), bei dem das gescannte Bild in eine Hintergrund-, eine Masken- und eine Vordergrundebene aufgeteilt wird. Jede Ebene kann einzeln mit speziellen Algorithmen komprimiert werden, die für ihren jeweiligen Zweck parametrisiert sind. Solche Algorithmen sind JBIG2 für die Maske und JPEG2000 für die Hintergrundebene. 

Es kann mehrere Vordergrundebenen geben, z. B. bei fotografischen Bildern, die Teil der gescannten Seite sind. Um diese Bilder von der Hintergrund- und Maskenebene zu trennen, muss ein spezieller Segmentierungsalgorithmus sie erkennen und isolieren. Jedes dieser Bilder kann nun eine eigene Vordergrundebene bilden, die mit einem speziellen Algorithmus wie JPEG komprimiert wird.

Die MRC-Methode für gescannte Seiten kann also wie folgt durchgeführt werden:

  • Segmentierungsalgorithmus: Erkennen und Isolieren von Bildern

  • Trennungsalgorithmus: Berechnung der Pixel der Bildmaske und des farbigen Hintergrunds.

  • Komprimierung jeder Ebene mit einem speziellen Komprimierungsalgorithmus

  • Setzen Sie die Ebenen nach einem MRC-Schema wie RFC 2301 in TIFF oder einem maskierten Bild in PDF zusammen.

Das Entfernen von Bildern aus der gescannten Seite kann auch den Texterkennungsprozess (OCR) beschleunigen. 

Es gibt aber noch eine interessantere Funktion, die angeboten werden kann. Wenn die besagten Bilder isoliert und einer eigenen Ebene zugeordnet wurden, können sie mit einem geeigneten Werkzeug leicht aus dem Dokument extrahiert werden.

Wenn Sie ein PDF-Dokument aus einer gescannten Seite erstellen, können Sie mit der optionalen Inhaltsfunktion die Hintergrund- und Vordergrundebenen ein- und ausschalten.

Unsere Produkte wie die 3-Heights™ TIFF Toolbox, der 3-Heights™ Scan Server und der 3-Heights™ Optimizer unterstützen nun die in diesem Artikel beschriebenen Funktionen. Um die Bilder aus einem PDF Dokument zu extrahieren, kann das 3-Heights™ PDF Extract Werkzeug verwendet werden.

Gefällt Ihnen, was Sie sehen? Teilen Sie es mit einem Freund.

Grüezi! Wie können wir helfen?

Telefon