PDF 2.0 – nouvelle génération
Il est rare que des produits industriels vivent plus de 20 ans. Il est encore plus étonnant que cela soit le cas dans le secteur de l’informatique. Au mois de juin 1993, lorsque la première version d’Acrobat a été commercialisée, même les créateurs du PDF ne pouvaient pas s’imaginer le succès incroyable qu’allait avoir leur format de fichier. À présent, les membres de l’organisation internationale de normalisation ISO travaillent sur la prochaine génération de ce format très populaire.
Norme ISO depuis le milieu de l’année 2008 sous la dénomination ISO-32 000-1 « Gestion de documents – Format de document portable – Partie 1 : PDF 1.7 », la sixième version du célèbre PDF Reference d’Adobe n’a pratiquement pas été modifiée depuis lors mais a seulement été traduite dans la langue ISO. Cela va bientôt changer avec la prochaine publication de la deuxième partie du standard « Partie 2 : PDF 2.0 » : la nouvelle version du PDF a été totalement élaborée par les membres de l’ISO, plus précisément par le comité technique 171, sous-comité 2. Pour mieux faire ressortir cette évolution, le numéro principal de la version est devenu un 2. Actuellement, la norme est au stade de projet de norme internationale (DIS, Draft International Standard), l’étape précédant la publication qui sera mise au vote le 16 septembre 2015.
Qu’apporte la nouvelle norme ?
La liste des modifications comporte plus de 50 entrées. Les principales nouveautés et améliorations concernent les points suivants :
Chiffrement : archivage non chiffré de documents cryptés, cryptage AES 256 bits, mots-clés unicode
Signatures numériques : signatures basées sur le standard CAdES, certificats basés sur des courbes elliptiques, signatures de longue durée (LTV)
Annotations : projections, 3D, médias interactifs
Accessibilité : indications pour la prononciation
3D : prise en charge de la nouvelle norme ISO « PRC », mesures dans l’espace 3D
Attributions de parties de documents
Le comité a aussi eu le courage de se défaire de quelques vieux fardeaux. Les principaux sont les suivants :
Formulaires XFA : une technologie d’Adobe basée sur XML qui a causé de grandes difficultés à de nombreux fournisseurs
Films, sons : les contenus multimédias ne correspondent pas au concept d’un format de document portable
Des informations superflues, redondantes, obsolètes ou non portables comme le Document Information Dictionary qui a été remplacé par XMP, des signatures numériques dépassées, des noms de fichiers dépendants du système d’exploitation et des standards très peu utilisés comme l’OPI (Open Prepress Interface)
Des révisions substantielles ont aussi été incluses dans la nouvelle section de la norme. Cela concerne surtout les chapitres suivants :
Affichage sur des équipements à base de trame (Rendering)
Transparence
Signatures numériques
Métadonnées
Accessibilité des documents (tagged PDF and accessibility support)
Toutefois, ces nombreux changements ont un coût. Les sept années nécessaires à l’élaboration de la deuxième partie représentent une durée nettement plus longue que celle des versions précédentes : Adobe avait publié sept versions en seulement 15 ans (et dans une qualité exceptionnelle). En revanche, la deuxième partie du standard bénéficie d’un large consensus au sein des membres de l’ISO. De nombreuses parties du texte sont formulées avec plus de précision. Cela permet à l’industrie de mieux comprendre les spécifications, d’augmenter la qualité des implémentations et donc d’améliorer l’interopérabilité. On espère qu’il y aura ainsi nettement moins de « mauvais PDF ».
Quelle est l’incidence de la nouvelle version ?
Pour les principales applications du PDF – l’archivage (PDF/A), l’échange de documents (PDF/X), l’ingénierie (PDF/E) et l’accessibilité (PDF/UA) –, l’ISO a défini des sous-standards spécialisés qui sont essentiellement basés sur la première partie de la norme PDF. Il est à prévoir que le développement de ces standards sera poursuivi afin qu’ils puissent se baser sur la deuxième partie. Néanmoins, il ne faut pas partir du principe que seule la norme-cadre est « nouvelle » et que les sous-standards sont « anciens ».
Au contraire, le développement de ces standards doit plutôt être compris comme une interaction. Ainsi, de nombreux changements dans la deuxième partie procèdent des enseignements tirés du travail sur les sous-standards qui ont été pris en considération lors du développement. De plus, contrairement à la norme-cadre PDF, les sous-standards pour PDF/X, PDF/E et PDF/UA ne sont pas soumis à une pression importante en faveur d’un changement car ils sont depuis longtemps développés continuellement en toute autonomie et indépendamment d’Adobe. La situation est un peu différente pour le PDF/A.
Le cas spécial de l’archivage
Dès que les premiers fichiers PDF de la version 2.0 seront employés, la question d’un archivage de ces fichiers conforme aux normes va tout de suite se poser. Le PDF/A doit pouvoir y apporter une réponse. Contrairement aux autres sous-standards du PDF, cette application est soumise à une certaine contrainte temporelle et le grand nombre de changements n’est pas non plus le meilleur gage d’une solution rapide. En outre, la communauté du PDF/A doit encore lutter contre d’autres problèmes, en particulier au sujet de la validation.
Le processus de validation permet de vérifier qu’un fichier PDF correspond à un certain standard. Ce type de vérification est surtout répandu pour les fichiers PDF/X et PDF/A. Pour l’archivage, la vérification est essentielle car le non-respect des standards peut aboutir à ce que les fichiers archivés ne puissent plus être lus sans aucun problème dans dix ans ou plus.
Différences dans la validation des fichiers PDF/A
Il existe un certain nombre de logiciels commerciaux (validateurs) qui vérifient la conformité aux différentes parties du standard PDF/A. Comme toutes les parties du standard PDF/A se réfèrent à certaines normes-cadres telles que le PDF 1.4, le PDF 1.7, etc., les validateurs devraient aussi contrôler la conformité à ces standards. En outre, les producteurs de ces validateurs interprètent souvent le texte des standards de manière différente. Ces deux phénomènes ont pour effet que les résultats du contrôle peuvent différer d’un produit à l’autre.
A cela s’ajoutent les attentes irréalistes de certains utilisateurs envers ce qu’un validateur doit pouvoir apporter. Les défauts des validateurs et les attentes irréalistes de certains utilisateurs peuvent tout deux conduire à une remise en question du concept des PDF/A. C’est pourquoi les appels en vue de créer un « validateur définitif » se font de plus en plus pressants.
Le projet VeraPDF
VeraPDF est un projet de l’Open Preservation Foundation. Il a été créé sous la forme d’un consortium entre la PDF Association, Dual Lab, The Digital Preservation Coalition et Keep Solutions. Le but du projet est de développer un validateur PDF/A qui a fait l’objet d’un appel d’offre de PREFORMA. PREservation FORMAts for Culture Information/E-Archives est un projet d’achat public avant commercialisation (PCP) initié dans le cadre du projet FP7-ICT. L’Open Source Validator de PREFORMA doit être employé pour trois formats standards de fichiers (en plus du PDF, ce sont le TIFF et un format pour les vidéos) et prendre en charge l’archivage de longue durée dans les institutions gardiennes de la mémoire. VeraPDF a remporté l’appel d’offres pour les deux premières phases de réalisation du validateur PDF/A. La première phase qui concernait essentiellement la spécification du validateur est terminée. La deuxième phase, la réalisation d’un prototype, est proche de sa conclusion.
L’expérience acquise sur ce projet montre qu’il n’est pas si facile de concevoir un validateur PDF/A entièrement nouveau. Cela nécessite une grande expérience des PDF et il n’est pas possible de confier cette tâche à un des producteurs commerciaux pour des raisons politiques. L’inclusion de la PDF Association a l’avantage d’intégrer l’expérience des fabricants et d’obtenir un large consensus sur la conception du validateur.
Ce système a cependant l’inconvénient que le développement est dès lors beaucoup plus complexe et dure plus longtemps. L’argent manque également pour une implémentation intégrale et on essaie de rendre le concept utilisable au moyen d’une architecture de logiciel appropriée (plug-in).
Un des avantages du projet par rapport aux validateurs commerciaux est que le validateur peut lui-même être « validé ». Cela doit être rendu possible par une publication de l’ensemble du code. En fait, personne ne regarde vraiment le code. C’est pourquoi on se concentre sur des fichiers test appropriés, mais il n’est pas surprenant de constater que le développement des fichiers test prend presque autant de temps que celui du validateur. Les suites de test existantes comme la suite Isartor conçues par la PDF Association est loin d’être suffisante.
Conclusion
Tandis que la nouvelle version de PDF est proche de sa publication, il n’est pas encore possible de compter sur des résultats concrets en provenance du projet VeraPDF de validation des documents PDF/A. En effet, les développements prévisibles de ce projet commencent à diviser la communauté et les premières déceptions pointent à l’horizon. De nombreux espoirs ne seront pas satisfaits, ou alors très tardivement. Les utilisateurs devront se fier encore longtemps aux validateurs commerciaux.
Grüezi! Comment pouvons-nous vous aider ?
PDF Tools AG
Brown-Boveri-Strasse 5
8050 Zürich, Switzerland