3-Heights™ OCR Enterprise Add-On – reconnaissance de texte pour des outils PDF

Le 3-Heights™ OCR Enterprise Add-On complète plusieurs produits de PDF Tools SA avec une reconnaissance de texte performante. Ceci permet d’ajouter des informations OCR lors de la conversion d’images de type TIFF ou JPEG en PDF ou PDF/A, ou lors de la conversion de PDF en PDF/A au cours d’un même processus.

Le client peut choisir librement le moteur OCR. ABBYY FineReader est actuellement disponible avec différents types de licences. Une solution adaptée peut ainsi être trouvée en fonction des exigences de degré de reconnaissance, de débit et de coûts.

PDF OCR Enterprise - fonctions

  • Fonctions générales
    • Ajouter des informations texte OCR pour des documents PDF
    • Définir la(les) langue(s) OCR en vue d’optimiser le taux de reconnaissance
    • Contrôle direct du moteur OCR ou commande via Service en vue de la synchronisation
    • Reconnaissance de documents multilingues
  • Fonctions spécifiques à ABBYY
    • Reconnaissance de près de 200 langues pour les contenus générés par machine
    • Prise en charge étendue à près de 50 langues grâce à des dictionnaires et à des outils morphologiques
    • chinois, japonais, coréen
    • langues européennes anciennes
    • Code-barres 2D
    • Reconnaissance de polices de machine à écrire
    • Reconnaissance et décodage de codes barre 1D
    • Reconnaissance de types de contenus (images par rapport à textes)
    • Sélection de mode rapide, précis et équilibré
    • De-Skewing : Reconnaissance automatique d’images
    • Nettoyage d’image : les artefacts indésirables sont reconnus et supprimés
    • Filtrage d’arrière-plans non pertinents
    • Reconnaissance et correction de l’orientation des images
    • Création et utilisation de profils permettant de regrouper les fonctions mentionnées ci-dessus
Graphique fonctionnel 3-Heights™ OCR Enterprise Add-On

Formats supportée

Formats d’entrée

Déterminé par le produit de base :

  • 3-Heights™ PDF to PDF/A Converter
    • PDF
  • 3-Heights™ Image to PDF Converter
    • TIFF (Tagged Image File Format)
    • JPEG (Joint Photographic Expert Group)
    • PNG (Portable Network Graphics)
    • GIF (Graphics Interchange Format)
    • BMP (Window Bitmap)
    • EPS (Encapsulated Post Script)
    • JB2 (JBIG2, Joint Bi-level Image Experts Group)
    • JP2 (JPEG2000)
    • JPX (Extended JPEG2000)
    • PBM (Portable Bitmap File Format)
    • JIF (GIF Flate)
  • 3-Heights™ Document Converter
    • Microsoft Office 2003 and 2007 documents
    • Document des anciennes versions de Microsoft Office
    • Simple Text
    • WordPerfect
    • HTML
    • Outlook (MSG)
    • PDF
    • Internet Mail Message Format
    • Image formats (TIFF, JPEG, PNG, JBIG2, JPX, GIF, BMP, etc.)
    • Archives ZIP et TAR
    • Add-ins pour des formats spécifiques au client

Formats de sortie

  • PDF, PDF/A

Produits de base nécessaires

Le 3-Heights™ OCR Enterprise Add-On peut être utilisé avec les produits de base suivants :

Loupe grossissante pour nos manuels PDF et notre exemple de code PDF

MANUEL

Add-On

Domaines d'application

Courrier entrant

Lors de la numérisation du courrier entrant, le texte est reconnu et peut être utilisé dans les méta-données des documents d’entrée ainsi que dans les processus d’entreprise situés en aval, tels que les systèmes ERP et workflow. Les documents en phase d’entrée sont directement archivés avec la reconnaissance de texte Une reconnaissance de texte est effectuée sur les pièces jointes d’e-mail numérisées pour simplifier le traitement ultérieur.

Archivage

Reconnaissance de texte lors de la conversion d’archives du format TIFF ou PDF au format PDF/A standardisé. Conversion de formats propriétaires en PDF/A et intégration des textes. Reconnaissance des informations sur les pages d’indexation et transfert dans les méta-données du document ou du dossier.

Autres domaines d’application

  • Numérisation de pièces jointes d’e-mail
  • Préparation à l’archivage
  • Migration d’archives

Bayer CropScience mise sur le format d’archivage à long terme PDF/A

Cette transformation est avantageuse pour le client à plusieurs titres : contrairement aux pages TIFF, il est possible d’effectuer des recherches dans les documents PDF et d’en copier/coller le contenu. De plus, l’index peut être utilisé pour naviguer rapidement dans le document.

PDF/A conversion with OCR recognition for Volkswagen Foundation’s document management

By integrating the 3-Heights™ components, the Volkswagen Foundation achieved a standardization of the different PDF variants in their DMS. As well, the conversion of different image formats into full-text indexed PDF documents is possible.

ABBYY

Le moteur ABBYY FineReader est disponible en trois versions pour Windows. ABBYY 8 n’est plus commercialisé :

  • ABBYY FineReader Engine 10
  • ABBYY FineReader Engine 11

Le moteur peut être téléchargé sur le site de ressources ou depuis votre espace personnel. La clé de licence requise pour activer la licence en mode d’évaluation ou de production ne peut être téléchargée que depuis votre espace de téléchargement personnel. Veuillez prendre contact avec nous si vous avez besoin d’une clé de licence.

Autres plateformes sur demande.