Du papier au numérique
La numérisation est probablement l’un des termes les plus courants de nos jours. Véritable buzzword dont le succès ne se dément pas, le mot surgit à la moindre question numérique. Dans son sillage, on trouve une multitude de noms d’entreprises, de penseurs du numérique et de gourous de la data. Mais quel est exactement l’apport de la numérisation en matière de capture de documents dans les entreprises ?
Source d'origine (allemand):
Passé et (toujours) présent
Bien avant l’ère numérique, une personne ouvrait le courrier, le triait, l’estampillait et le déposait dans le casier du destinataire. Ce dernier prenait alors connaissance du document et, s’il s’agissait par exemple d’une facture, l’enregistrait et la saisissait dans le système de comptabilité. Il transmettait ensuite le document pour signature au responsable du centre de coûts.
Une fois validée, la facture revenait et l’on pouvait alors la régler et la ranger dans un épais classeur, qui finirait bientôt archivé au sous-sol. Les armoires à archives étaient pleines, les classeurs s’entassaient dans les sous-sols et, lorsque l’on avait besoin d’un document, il fallait se lancer à sa recherche à travers les rayonnages, les dossiers et les registres. Le papier est synonyme de tâches fastidieuses et coûteuses. Sans parler du risque de ranger par erreur un dossier ou un document au mauvais endroit ! Un grand nombre d’entreprises ont encore un pied dans le passé mais se préoccupent aujourd’hui activement de numériser leurs processus.
La numérisation au service de la capture de documents ?
Le passage au numérique apporte une valeur ajoutée à de nombreux processus de l’entreprise. Prenons par exemple un autre buzzword la « capture » de documents. Chaque jour, nous sommes inondés de documents, de données, d’e-mails et autres informations. Nous recevons des informations cruciales pour l’activité de l’entreprise et d’autres, moins pertinentes, à travers différents canaux et dans de multiples formats. Les processus numériques peuvent prendre en charge le suivi de ces données entrantes, leur numérisation, leur tri, leur classement et leur transmission vers les étapes de travail appropriées. La numérisation doit être un outil servant à optimiser la préparation des étapes de processus suivantes. Malheureusement, les machines et les algorithmes ne sont pas toujours en mesure de gérer toutes les situations.
Pour permettre le traitement des documents entrants, il convient de les numériser et d’utiliser un moteur de reconnaissance optique de caractères (OCR – Optical Character Recognition), capable d’identifier les informations requises, de les lire et de les associer à chaque document. Cette étape préalable de reconnaissance et de lecture est indispensable, par exemple, pour permettre la gestion efficace de factures fournisseur de différents formats par un processus de paiement électronique.
La reconnaissance de texte, ou OCR, permet d’accélérer le traitement de la facture, depuis sa réception jusqu’à son règlement, en passant par sa comptabilisation. En outre, grâce aux informations enregistrées, il est possible de retrouver à tout moment une facture particulière au moyen de critères de recherche. Plus besoin de la version papier une fois que l’on a numérisé la facture, enregistré toutes les données requises, effectué la validation et le paiement puis stocké le document en sécurité dans les archives électroniques. Cette dernière étape ne consiste pas seulement à stocker le document mais également à le protéger en tant que tel en termes d’accès, d’horodatage et de signature électronique.
La transformation en cours à l’heure actuelle influe en outre sur le poste de travail des collaborateurs et pose la question de la flexibilité. De plus en plus d’employés travaillent depuis leur domicile et ont besoin de consulter les documents de l’entreprise. La numérisation leur procure l’accès aux informations dont ils ont besoin. Les adeptes du « clean desk » y trouvent aussi leur compte, puisque la transformation numérique ne cesse de réduire le volume de documents papier présents sur les bureaux. Par ailleurs, les processus à l’œuvre dans l’entreprise impliquent aussi d’émettre des documents vers l’extérieur. Là encore, la forme électronique est très largement synonyme de rapidité, de sécurité et d’efficacité accrues.
Mais il y a encore mieux ! Lors d’une vérification des comptes de l’entreprise, plus besoin de sortir des caisses entières de classeurs du sous-sol pour les remettre au vérificateur dans la salle de réunion : il suffit de lui accorder les droits d’accès en lecture aux dossiers pour qu’il puisse afficher et vérifier les documents à partir des archives numériques. Tout le monde y gagne en temps et en sérénité. Pour ceux qui préfèrent, une alternative consiste à enregistrer les documents sur une clé USB sécurisée pour la remettre au vérificateur.
Numérisation – la moisson numérique
Les canaux empruntés par les documents pour entrer dans l’entreprise sont nombreux, de même que les formats et les qualités de ces documents. Il importe de « capturer » ces documents dans la mesure du possible, qu’ils existent en version papier ou numérique. À l’ère de la facturation électronique, des guichets en ligne et de l’e-commerce, le papier est loin d’avoir disparu : des documents tels que les factures, les formulaires pour les impôts, les rapports de service et les contrats sont souvent imprimés sur papier, envoyés par courrier et reçus par courrier.
Par conséquent, il faut numériser ces documents papier pour les convertir dans le format électronique compatible avec les processus documentaires. Pour ce faire, une bonne qualité d’image est cruciale afin d’atteindre un taux de reconnaissance de caractères satisfaisant. Et pour garantir à la fois un taux de compression élevé et une bonne qualité d’image, la machine utilisée doit offrir une bonne puissance de calcul, ce qui n’est pas le cas de la plupart des MFP. En règle générale, le scanner génère une image au format TIFF ou JPEG pour chaque page que l’on numérise. Certains scanners peuvent même créer directement des fichiers PDF. Quant aux appareils de dernière génération, ils produisent des fichiers conformes au standard PDF/A. Toutefois, la qualité des fichiers créés peut varier fortement selon le fabricant du scanner ou le logiciel de conversion.
Pour remédier à ce problème de qualité, il est conseillé d’utiliser un serveur de numérisation central. Le service prend en charge toutes les tâches que les postes de numérisation décentralisés peuvent lui déléguer. Il récupère les images numérisées, analyse les documents et crée un document PDF/A avec toutes les informations textuelles et visuelles et avec une compression appropriée. À titre facultatif, il marque le document avec un jeton d’horodatage ou une signature numérique. Les informations saisies sont ainsi mises à disposition en très bonne qualité aussi bien pour les lecteurs humains que pour un traitement automatisé par des applications informatiques.
Par ailleurs, certains documents arrivent dans l’entreprise au format numérique. Malheureusement, leurs auteurs ont souvent produit des fichiers PDF de qualité insuffisante, ce qui engendre des problèmes et des coûts imprévus au niveau de la gestion des documents. En effet, la conversion au format PDF ne se résume pas à encapsuler une image dans une structure PDF. La création d’un document PDF peut englober la reconnaissance de texte et de codes-barres, l’insertion de métadonnées et l’ajout de signatures numériques.
Les progrès technologiques fulgurants entraînent un vieillissement rapide des systèmes actuels qui devront bientôt être remplacés. En revanche, le contenu des documents archivés reste pertinent et doit donc pouvoir être transféré fidèlement vers les nouveaux systèmes. Un format de document stable qui survivra au cycle de vie des systèmes est le meilleur garant d’une migration sans perte.

Du point au bit
Une solution de numérisation équipée de la technologie de reconnaissance optique de caractères (OCR) permet d’enrichir tous les documents avec des informations additionnelles qui s’avéreront utiles tout au long du processus documentaire. Un document – formulaire papier numérisé, document électronique, voire e-mail doté de pièces jointes – peut ainsi être affecté à un service ou un processus particulier d’après ses attributs textuels, sa structure et les éléments qu’il renferme.
Le document peut être identifié par exemple en tant que courrier normal, commande, bon de livraison ou facture et transmis en fonction de sa clé de répartition. Il en résulte une plus grande efficacité lors des processus de traitement et des cycles de décision avals.
Une reconnaissance de texte efficace avec traitement subséquent n’améliore donc pas la seule opération de capture. Elle facilite aussi le classement, la distribution des documents et les opérations de traitement aval. En outre, elle garantit un contrôle et une traçabilité plus performants des documents à des fins de compliance. Outre l’enrichissement en informations, la technologie OCR permet la recherche de mots-clés, l’utilisation de fonctions de reporting et la création de dossiers thématiques. De cette façon, elle améliore la réactivité et accélère le traitement.
Tandis que l’échange de documents électroniques s’impose aujourd’hui comme une évidence dans le cadre des activités de l’entreprise, la question de la qualité des documents a tendance à être négligée. Dans tous les cas, la mise en œuvre d’un système de contrôle qualité des documents entrants s’avère indispensable. Toutefois, avant d’instaurer un tel dispositif – ou « Quality Gate » –, il importe de clarifier ce que l’on entend par qualité. Une large partie des entreprises configurent leur processus documentaire pour prendre en charge un format principal. Cela simplifie l’ensemble des opérations de traitement, évite d’avoir une multitude de formats en circulation et garantit un contrôle plus efficace au final.
Dans le cas où le format standard est PDF, deux sortes de qualités entrent en considération : la qualité intrinsèque et la qualité dédiée. La qualité intrinsèque mesure la conformité à la spécification de format de fichier (ISO 32000) car un fichier a beau porter l’extension PDF, il n’en est pas toujours véritablement un. Ou du moins, il n’est pas forcément compatible avec les différentes étapes de traitement aval voulues par l’entreprise jusqu’à l’archivage.
La qualité dédiée concerne les applications possibles comme la numérisation, l’échange de documents, l’impression et l’archivage. Par exemple, les polices et les couleurs sont-elles optimisées et les fichiers répondent-ils aux exigences du standard PDF/A en vue d’un archivage numérique à long terme. Un « Quality Gate » doit donc porter sur la capture, mais également sur la validation, la réparation, l’optimisation et la signature numérique et, partant, sur la protection des documents.
Il est primordial de planifier et de tester attentivement le processus documentaire quel qu’en soit le degré de complexité. Ce processus doit prendre en compte les documents à la fois externes et internes, ainsi que leur contrôle, leur enrichissement, leur distribution et leur stockage. Un processus bien pensé améliore la réactivité, protège les ressources à tous les niveaux et garantit une transparence accrue à des fins de suivi et de compliance.
Conclusion
En matière de capture de documents, un serveur de numérisation central avec reconnaissance optique de caractères ou OCR (Optical Character Recognition), complété par un « Quality Gate », garantit l’efficacité du processus documentaire digital. La reconnaissance de texte permet de catégoriser les informations capturées, d’orienter le parcours d’un document à travers l’entreprise, d’organiser efficacement le processus documentaire et de faciliter les recherches ultérieures. Le « Quality Gate » garantit la qualité pérenne et la sécurité des documents. L’automatisation minimise les sources d’erreur, augmente la qualité des documents et limite les coûts et la charge de travail – depuis l’entrée des documents dans l’entreprise jusqu’à leur archivage à long terme.
Enfin, outre les bits et les octets, le facteur humain est important et doit être pris en compte – et notamment la question de la simplicité d’utilisation ou de la protection des données. L’excellence technique d’une solution logicielle ne va pas nécessairement de pair avec l’acceptation par les utilisateurs et la transparence vis-à-vis des lois et règlements. Pour satisfaire également ces deux critères, la solution doit reposer sur un concept clair et juste. Elle doit permettre la traçabilité non seulement au niveau des fichiers numérisés dans l’archive, mais aussi dans l’esprit des gens.
La capture de documents n’a rien d’un tour de magie ; elle consiste simplement à saisir, contrôler et enrichir des informations. En revanche, elle est source de nombreux avantages – alors, oubliez le casse-tête des classeurs à archives et dites oui à la numérisation.
Grüezi! Comment pouvons-nous vous aider ?
PDF Tools AG
Brown-Boveri-Strasse 5
8050 Zürich, Switzerland