Automatisieren Sie Ihre Datenextraktion
Java | C# | .NET Core | nuget | C/C++ | COM | Command Line
3-Heights™ PDF Extract ist ein effizienter und vielseitiger PDF Inhalt- und Metadaten Parser und Extraktor. Er bildet die technische Grundlage für verschiedenste Lösungen: Von der einfachen PDF nach Text Konvertierung bis zu komplexen Business Intelligence und Big Data Lösungen. PDF Extract erlaubt die präzise und vollständige Überführung von binären Daten (PDF) in strukturierte Informationen, z.B. in Unicode, Bilder und Metadaten. Das Produkt stellt dafür eine seitenbasierte Extraktion via Kommandozeile zur Verfügung, aber auch eine API zur Ausprogrammierung komplexerer Operationen, z.B. in C#, Java, Visual Basic oder C/C++.
Unterschiedliche Teams in der Finanzabteilung kümmern sich darum, dass Daten aus Rechnungen, welche in PDF Format vorliegen, verarbeitet und in die Datenbank übernommen werden. Andere sind für die Bezahlung von Rechnungen, die Analyse der Ergebnisse und das Berichtswesen an die Kunden zuständig.
Die Redaktoren des Kunden von Oppolis können nun mit dem Einsatz von GoArchive schnell und einfach recherchieren und so PDF Dokumente suchen, finden und importieren. Zudem ist die Verfügbarkeit für externe Benutzer der PDF Dokumente im Archiv der Regionalzeitung sichergestellt, trotz grossvolumiger Veröffentlichungsarchive.
Inhaltsteile von PDF Dateien, z. B. von Formularen oder gescannten Eingangsrechnungen, werden extrahiert und für die Charakterisierung oder Indexierung aufbereitet.
Wichtige Informationen wie Produkte Informationen, Kundendaten oder Firmen Wissen werden in PDF Dokumenten abgelegt. Metainformationen, wie der Ersteller des Dokumentes, das Erstellungsdatum oder Änderungsdatum sind Bestandteil eines PDF Dokumentes. Oft werden PDF Dokumente als «Container» verwendet, so dass Text, Bilder, Videos und andere Daten Plattform unabhängig an andere Arbeitsprozesse übermittelt werden können.
PDF Dokumente werden umstrukturiert, um diese für andere Zielgruppen optimal aufzubereiten. Verarbeitungsinformationen wie Barcodes, Adressinformationen oder Seitenformate können ausgelesen und für die Steuerung von Druck- und Verpackungsstrassen oder Sortierungsprozesse verwendet werden.