Scannez le serveur pour l'archivage numérique à long terme

Ces jours, La plupart des entreprises ne veulent plus perdre de temps et d'argent en remplissant des pièces sans fenêtre avec des fichiers papier ou en assignant du personnel à la recherche de documents papier. De plus en plus de gestionnaires réalisent les avantages de l'archivage numérique, et pas seulement dans les grandes entreprises. Mais comment la mettre en œuvre? Certains disent laisser les fabricants des appareils de numérisation, tandis que d'autres pensent qu'il faut plus que cela.

Un scanner suffit-il ?

Dans la plupart des entreprises, la numérisation de documents papier est devenue une tâche de routine lors du traitement des courriers entrants. Des imprimantes multifonctions (MFP) ou des scanners haute performance sont utilisés à cette fin, selon le type et le volume de documents papier reçus.

Dans la plupart des cas, les images numérisées sont créées sous forme de fichiers TIFF noir et blanc, le format typique utilisé par les télécopieurs. Dans des cas particuliers, comme lors de la numérisation de vérifications ou de photos d'identité, le fichier est généré en couleur. Cependant, la numérisation des couleurs est généralement évitée, puisque les fichiers TIFF créés sont soit trop volumineux, soit la compression JPEG réduit visiblement la qualité de l'image.

Mais une bonne qualité d'image est une exigence importante pour un bon taux de reconnaissance de texte. Atteindre une bonne qualité d'image à un taux de compression élevé nécessite un niveau de puissance de traitement que les imprimantes locales multifonctions ne possèdent pas habituellement. Un logiciel de numérisation séparé peut offrir des avantages considérables à cet égard.

Habituellement, les étapes de traitement individuelles, telles que la reconnaissance de texte, la compression, la génération PDF/A et la signature numérique, ne peut pas être effectué par le scanner seul, car les métadonnées sont souvent ajoutées rétroactivement par une station d'index. Cependant, cette étape de travail rompt le sceau de la signature numérique et le rend inutile. Ici aussi, les logiciels distincts peuvent offrir un avantage décisif.

PDF/A – un standard de document universel

La norme PDF/A est maintenant largement établie dans les applications de messagerie entrantes. La norme PDF/A offre les avantages importants suivants par rapport aux formats de documents conventionnels, tels que TIFF et JPEG :

  • Format standardisé PDF/A est adapté pour stocker des documents numérisés et numérisés.

  • Taux de compression élevé Le standard PDF/A prend en charge des processus de compression plus modernes et plus puissants, et donc des petits formats pour les images en couleurs.

  • Reconnaissance du texte Les documents PDF/A créés peuvent être recherchés en intégrant du texte à partir d'un moteur OCR.

  • Embedded metadata Afin que le document et les métadonnées associées forment un tout inséparable, les métadonnées sont intégrées dans le fichier en PDF/A. Pour l'enregistrement, PDF/A utilise le format Extensible Metadata Platform (XMP), qui, comme PDF/A, est également défini comme son propre standard ISO.

  • Signature numérique Afin de garantir l'intégrité et l'authenticité des documents créés, une signature numérique peut être appliquée au document PDF/A conformément à la norme PAdES. La signature numérique est une sorte de signature électronique qui peut servir le même but qu'une signature manuscrite, à condition que les exigences légales correspondantes (lois nationales de signature) soient respectées.

En principe, les documents TIFF offrent tous ces avantages, mais uniquement en tant que extensions propriétaires, puisque la norme TIFF elle-même n'offre pas de solutions

Que peut faire un serveur de balayage central?

Un serveur de scan est un service central qui convertit les fichiers localement scannés et les fichiers d'index associés en format de fichier PDF/A standardisé au sein d'une entreprise. À cette fin, le service exécute toutes les tâches qui peuvent lui être déléguées par la station de balayage locale. La solution est particulièrement adaptée aux étapes de traitement qui ne nécessitent aucune interaction utilisateur ou qui nuisent à l'efficacité de la station de numérisation locale avec des fonctions CPUintensive (OCR, compression).

Les principales fonctions de ce service sont :

  • Reconnaissance du texte et du code-barres Les fichiers image numérisés doivent être rendus interrogeables. Les services peuvent utiliser le service OCR à 3 hauteurs®️ pour identifier le texte dans un fichier image et l'intégrer dans le fichier converti de manière à le rendre consultable. Les codes à barres reconnus peuvent être utilisés de plusieurs façons : dans la recherche de texte, dans le cadre des métadonnées intégrées, ou pour contrôler le traitement (nom du fichier de sortie, séparation de page, etc.). dans le service.

  • Compression Les images en couleurs sont divisées en plusieurs éléments. En utilisant le processus MRC, ils sont ensuite fortement compressés sans perte visible.

  • Intégration des métadonnées Le standard PDF/A nécessite que les métadonnées soient intégrées dans le document sous la forme de paquets XMP. Cette fonction est offerte par le service.

  • Création PDF/A Le service crée des documents de sortie simples ou multi-pages conformément à la série de normes ISO 19005. Toutes les parties publiées de la norme – PDF/A-1, PDF/A-2 et PDF/A-3 – sont supportées.

  • Signature numérique La signature peut être avancée ou qualifiée, adaptée pour un stockage à long terme ou simplement pour un échange. Il peut également contenir un timbre horaire. Un tampon unique peut être appliqué à la place de la signature personnelle. Le service peut utiliser une infrastructure cryptographique (jeton USB, HSM) via une interface standard (PKCS#11) pour créer une signature numérique.

    Une séquence typique ressemblerait à ceci:

  • Acquisition d'images L'opérateur de numérisation lance le processus de numérisation et crée un fichier TIFF couleur. Le scanner stocke généralement les fichiers dans un dossier de fichiers. Les documents de télécopieur sont reçus par le télécopieur et stockés dans un dossier spécial sous forme de fichiers TIFF noir et blanc.

  • Classification manuelle Selon le processus, l'opérateur de numérisation peut effectuer une classification manuelle. Ils contrôlent le scanner de sorte que les images soient stockées dans différents dossiers (par ex. factures et bons de livraison), ou des feuilles de code-barres spéciales sont ajoutées qui aident à séparer et classer les documents, ou un ensemble minimum de fichiers d'index est créé.

  • Segmentation et compression L'image en couleur de chaque page est divisée en différents éléments, tels que l'arrière-plan, le texte et les images. La taille des différents éléments est ensuite réduite en les soumettant à des processus de compression spécifiquement conçus pour ce type d'élément. Ce processus de la MRC permet d'obtenir des formats de fichiers compétitifs pour les documents en couleur.

  • Reconnaissance du texte et du code-barres Les images sont traitées ultérieurement par un moteur OCR. L'image est nettoyée et détrempée, et la reconnaissance du texte et du code-barres a lieu ensuite.

  • Métadonnées Les informations provenant de la classification manuelle, des codes-barres reconnus et d'autres sources sont assemblées en métadonnées XMP standardisées.

  • Création PDF/A Les images préparées de chaque page, le texte reconnu et les métadonnées sont assemblés en un document PDF/A avec le profil couleur ICC du scanner. Optionnellement, un fichier d'index contenant seulement les métadonnées peut être créé.

  • Signature numérique Si vous le souhaitez, les fichiers PDF/A peuvent être signés numériquement afin de préserver la traçabilité et l'intégrité de révision des documents.

  • Validation En option, la conformité PDF/A du document créé et la validité de la signature numérique peuvent être vérifiées. Le service offre également une gamme de fonctions supplémentaires.

Où le service peut-il être utilisé?

Un serveur de scan est utilisé dans les buts suivants :

  • Capture papier Archivage électronique des documents papier reçus comme courrier entrant dans une entreprise.

  • Capture de Facsimile Archivage électronique de toutes les transactions par télécopieur entre la société et ses partenaires commerciaux.

  • Migration des archives Migration des archives papier vers une archive électronique au format PDF/A normalisé.

  • Capture Web/Mobile Utilisation du service central dans les applications client/serveur via un service web.

  • Intégration d'applications d'entreprise Utilisation du service central pour la création de documents PDF/A via une interface de programmation (API) à partir d'applications spécialisées qui créent des fichiers TIFF ou JPEG.

Summary

Bien que le développement d'une archive numérique à long terme soit devenu essentiel dans les grandes entreprises, elle profite également aux petites et moyennes entreprises en réduisant leurs coûts de stockage et de personnel.

Un processus de numérisation bien conçu peut aider à éliminer le besoin de papier gênant dès le début de la chaîne (c'est-à-dire le courrier entrant). En même temps, la validité des documents électroniques est assurée par des signatures numériques. Grâce à un service de numérisation centralisée, les entreprises peuvent mettre en place un processus d'archivage puissant, souple et durable.

PDF/A, un format de fichier standardisé pour l'archivage à long terme, ne convient pas seulement aux documents numérisés, mais sert également de format universel pour les documents créés numériquement.

Like what you see? Share with a friend.

Dr. Hans Bärfuss

Written by Dr. Hans Bärfuss

Dr. Hans Ba<unk> rfuss est le fondateur et directeur de PDF Tools AG. Il est délégué de la Swiss Standards Association (SNV) pour la norme ISO et contribue à standardiser les formats de fichiers et les signatures numériques. Il est l'un des initiateurs et fondateurs de l'Association PDF et Président du Chapitre Suisse.

« Gru<unk> ezi! » Comment pouvons-nous nous aider?

Phone