3-Heights™ OCR Enterprise Add-On – reconnaissance de texte pour des outils PDF

Le 3‑Heights™ OCR Enterprise Add‑On complète plusieurs produits de PDF Tools SA avec une reconnaissance de texte performante. Ceci permet d’ajouter des informations OCR lors de la conversion d’images de type TIFF ou JPEG en PDF ou PDF/A, ou lors de la conversion de PDF en PDF/A au cours d’un même processus.

Le client peut choisir librement le moteur OCR. ABBYY FineReader est actuellement disponible avec différents types de licences. Une solution adaptée peut ainsi être trouvée en fonction des exigences de degré de reconnaissance, de débit et de coûts.   

Propriétés et points forts

Le 3-Heights™ OCR Enterprise Add‑On est un module OCR utilisé en association avec d’autres produits de PDF Tools SA.
Basé sur le moteur OCR choisi, il reconnait les contenus texte et les insère sous forme de texte Unicode dans le document PDF et PDF/A. Ceci permet d’effectuer des recherches en mode texte intégral dans les documents PDF. De nombreuses options de manipulation d’image, pré-traitement et reconnaissance de texte permettent d’optimiser le processus de reconnaissance en fonction des besoins.

Caractéristiques

  • Moteurs OCR disponibles :

    • ABBYY FineReader OCR Engine

  • Selon le moteur OCR, prise en charge de jusqu’à 200 langues
  • Prise en charge étendue grâce à des dictionnaires
  • Clé de licence Migration

Fonctions générales

  • Ajouter des informations texte OCR pour des documents PDF
  • Définir la(les) langue(s) OCR en vue d’optimiser le taux de reconnaissance
  • Contrôle direct du moteur OCR ou commande via Service en vue de la synchronisation
  • Reconnaissance de documents multilingues
Functionality graphic 3-Heights™ OCR Enterprise Add-On

Fonctions spécifiques à ABBYY

  • Reconnaissance de près de 200 langues pour les contenus générés par machine
  • Prise en charge étendue à près de 50 langues grâce à des dictionnaires et à des outils morphologiques
  • chinois, japonais, coréen
  • langues européennes anciennes
  • Code-barres 2D
  • Reconnaissance de polices de machine à écrire
  • Reconnaissance et décodage de codes barre 1D
  • Reconnaissance de types de contenus (images par rapport à textes)
  • Sélection de mode rapide, précis et équilibré
  • De-Skewing : Reconnaissance automatique d’images
  • Nettoyage d’image : les artefacts indésirables sont reconnus et supprimés
  • Filtrage d’arrière-plans non pertinents
  • Reconnaissance et correction de l’orientation des images
  • Création et utilisation de profils permettant de regrouper les fonctions mentionnées ci‑dessus

Courrier entrant

Lors de la numérisation du courrier entrant, le texte est reconnu et peut être utilisé dans les méta-données des documents d’entrée ainsi que dans les processus d’entreprise situés en aval, tels que les systèmes ERP et workflow. Les documents en phase d’entrée sont directement archivés avec la reconnaissance de texte Une reconnaissance de texte est effectuée sur les pièces jointes d’e‑mail numérisées pour simplifier le traitement ultérieur.

Archivage

Reconnaissance de texte lors de la conversion d’archives du format TIFF ou PDF au format PDF/A standardisé. Conversion de formats propriétaires en PDF/A et intégration des textes. Reconnaissance des informations sur les pages d’indexation et transfert dans les méta-données du document ou du dossier.

Autres domaines d’application

  • Numérisation de pièces jointes d’e‑mail
  • Préparation à l’archivage
  • Migration d’archives

Formats d’entrée

Déterminé par le produit de base :

  • 3‑Heights™ PDF to PDF/A Converter

    • PDF

  • 3‑Heights™ Image to PDF Converter

    • TIFF (Tagged Image File Format)
    • JPEG (Joint Photographic Expert Group)
    • PNG (Portable Network Graphics)
    • GIF (Graphics Interchange Format)
    • BMP (Window Bitmap)
    • EPS (Encapsulated Post Script)
    • JB2 (JBIG2, Joint Bi-level Image Experts Group)
    • JP2 (JPEG2000)
    • JPX (Extended JPEG2000)
    • PBM (Portable Bitmap File Format)
    • JIF (GIF Flate)

  • 3‑Heights™ Document Converter

    • Documents Microsoft Office 2003 et 2007 
    • Document des anciennes versions de Microsoft Office
    • Simple Text
    • WordPerfect
    • HTML
    • Outlook (MSG)
    • PDF
    • Internet Mail Message Format
    • Formats d'image (TIFF, JPEG, PNG, JBIG2, JPX, GIF, BMP, etc.)
    • Archives ZIP et TAR
    • Add-ins pour des formats spécifiques au client

Formats de sortie

  • PDF, PDF/A

Produits de base nécessaires

Le 3‑Heights™ OCR Enterprise Add‑On peut être utilisé avec les produits de base suivants:

Système d'exploitation

  • Windows 7, 8, 8.1, 10
  • Windows Server 2008 R2, 2012, 2012 R2 – 64 Bit
  • Windows Server 2008 - 32 / 64 Bit

Interfaces

  • API: C, Java, .NET, COM
  • Shell Tool : ligne de commande pour traitement par lots
  • Windows Service : service Windows avec répertoires surveillés

ABBYY

Le moteur ABBYY FineReader est disponible en trois versions pour Windows. ABBYY 8 n’est plus commercialisé :

  • ABBYY FineReader Engine 10
  • ABBYY FineReader Engine 11

Le moteur peut être téléchargé sur le site de ressources ou depuis votre espace personnel. La clé de licence requise pour activer la licence en mode d’évaluation ou de production ne peut être téléchargée que depuis votre espace de téléchargement personnel. Veuillez prendre contact avec nous si vous avez besoin d’une clé de licence.

 

Autres plateformes sur demande.

Références 3-Heights™ OCR Enterprise Add-On