PDF 2.0 - die nächste Generation

Es ist selten, dass Industrieprodukte mehr als 20 Jahre überleben - besonders in der IT-Branche. Nicht einmal die Erfinder des PDF-Formats konnten ahnen, wie erfolgreich ihr Dateiformat sein würde, als sie im Juni 1993 die erste Version von Acrobat auf den Markt brachten. Die Mitglieder der Internationalen Organisation für Normung (ISO) arbeiten nun an der nächsten Generation dieses beliebten Formats.

Seit ISO-32000-1 mit dem Titel "Dokumentenmanagement - Portable Document Format - Teil 1: PDF 1.7" Mitte 2008 veröffentlicht wurde, hat sich die sechste Ausgabe der berühmten PDF-Referenz von Adobe nicht wesentlich verändert - sie wurde lediglich in die ISO-Sprache übersetzt. Dies wird sich jedoch ändern, wenn der zweite Teil des Standards, "Part 2: PDF 2.0", in Kürze veröffentlicht wird. Diese neue Version wurde von den ISO-Mitgliedern erstellt, genauer gesagt vom Technischen Komitee 171, Unterkomitee 2. Um deutlich zu machen, dass es sich um eine neue Norm handelt, wurde der Hauptversionsnummer eine "2" hinzugefügt. Die Norm befindet sich derzeit im DIS-Stadium (Draft International Standard), einem Schritt kurz vor der Veröffentlichung, und wird am 16. September 2015 zur Abstimmung gestellt.

Was wird die neue Norm bieten?

Die Liste der Änderungen umfasst mehr als 50 Einträge. Die wichtigsten Änderungen und Verbesserungen beziehen sich auf die folgenden Bereiche:

  • Verschlüsselung: unverschlüsselter Wrapper für verschlüsselte Dokumente, 256-Bit-AES-Verschlüsselung, Unicode-Passwörter

  • Digitale Signaturen: Signaturen auf der Grundlage des CAdES-Standards, Zertifikate auf der Grundlage elliptischer Kurven, langfristige Signaturvalidierung (LTV)

  • Annotationen: Projektionen, 3D, Rich Media

  • Zugänglichkeit: Aussprachehinweise

  • 3D: Unterstützung für den neuen ISO-Standard "PRC", 3D-Messungen

  • Teile des Dokuments

Der Ausschuss war auch mutig genug, einige überholte Funktionen zu streichen; die wichtigsten davon sind:

  • XFA-Formulare: Die XML-basierte Formulartechnologie von Adobe war für viele Anbieter eine ständige Quelle der Frustration

  • Film, Ton: Multimediale Inhalte sind nicht mit dem Konzept eines portablen Dokumentenformats vereinbar.

  • Überflüssige, redundante, veraltete oder nicht portierbare Informationen, wie das Dokumentinformationsverzeichnis (ersetzt durch XMP), veraltete digitale Signaturen, betriebssystemabhängige Dateinamen und selten verwendete Standards wie OPI (Open Prepress Interface)

Auch im neuen Teil der Norm wurden einige wichtige Änderungen vorgenommen, insbesondere in den folgenden Kapiteln:

  • Rendering

  • Transparenz

  • Digitale Signaturen

  • Metadaten

  • Tagged PDF und Barrierefreiheit Unterstützung

Aber die zahlreichen Änderungen haben ihren Tribut gefordert. Es hat sieben Jahre gedauert, den zweiten Teil zu erstellen, viel länger als für frühere Versionen nötig war. Tatsächlich hat es Adobe geschafft, in nur 15 Jahren sieben Versionen herauszubringen - und das in hervorragender Qualität. Positiv zu vermerken ist, dass der zweite Teil der Norm von den ISO-Mitgliedern intensiv mitgestaltet wurde und dass viele Textstellen klarer formuliert sind. Dies erleichtert der Industrie das Verständnis der Spezifikation, erhöht die Qualität der Umsetzung und verbessert damit die Interoperabilität. Es ist zu hoffen, dass dies zu weit weniger "schlechten" PDFs führen wird.

Welche Auswirkungen wird die neue Version haben?

Für die wichtigsten Verwendungszwecke von PDF - d.h. Archivierung (PDF/A), Dokumentenaustausch (PDF/X), Engineering (PDF/E) und Barrierefreiheit (PDF/UA) - hat die ISO spezielle Unterstandards definiert, die größtenteils auf dem ersten Teil des PDF-Standards basieren. Es ist wahrscheinlich, dass auch diese Normen angepasst werden, um sie für den zweiten Teil relevant zu machen. Es sollte jedoch nicht davon ausgegangen werden, dass die Hauptnorm nun "neu" und die Teilnormen "alt" sind.

Stattdessen sollte die Entwicklung dieser Normen als eine Interaktion betrachtet werden. So basieren viele Änderungen im zweiten Teil des PDF-Standards auf Erkenntnissen, die aus der Arbeit an den Sub-Standards gewonnen wurden und in die Entwicklung eingeflossen sind. Zudem besteht - anders als beim PDF-Master-Standard - bei den Sub-Standards PDF/X, PDF/E und PDF/UA keine wirkliche Dringlichkeit zur Änderung, da sie bereits seit einiger Zeit unabhängig von Adobe optimiert wurden. Bei PDF/A ist die Situation etwas anders.

Der Sonderfall der Archivierung

Sobald die ersten PDF-Dateien der Version 2.0 erstellt werden, stellt sich die Frage, wie sie standardkonform archiviert werden können. PDF/A muss eine Antwort auf diese Frage geben. Im Gegensatz zu den anderen PDF-Subnormen steht diese Anwendung unter einem gewissen Zeitdruck. Doch die schiere Anzahl der Änderungen macht es schwierig, eine schnelle Lösung zu finden. Die PDF/A-Gemeinschaft sieht sich auch mit anderen Problemen konfrontiert, insbesondere im Zusammenhang mit der Validierung.

Bei der Validierung wird geprüft, ob eine PDF-Datei einem bestimmten Standard entspricht. Diese Prüfung ist bei PDF/X- und PDF/A-Dateien üblich und für Archivierungszwecke unerlässlich, da Verstöße gegen die Norm dazu führen können, dass archivierte Dateien nach 10 oder mehr Jahren nicht mehr einwandfrei lesbar sind.

Unterschiede bei der Validierung von PDF/A-Dateien

Für die Prüfung der Konformität mit verschiedenen Teilen des PDF/A-Standards können verschiedene kommerzielle Softwareprogramme (Validatoren) eingesetzt werden. Da alle Teile des PDF/A-Standards auf bestimmten Masterstandards wie PDF 1.4 und PDF 1.7 basieren, müssen die Validatoren auch die Konformität mit diesen Standards prüfen. Hinzu kommt, dass die Hersteller dieser Validierer den Text der Normen oft unterschiedlich interpretieren. Beides kann dazu führen, dass verschiedene Validatoren unterschiedliche Prüfergebnisse liefern.

Darüber hinaus haben einzelne Anwender möglicherweise unrealistische Erwartungen an das, was ein Validator leisten kann und sollte. Sowohl die Unzulänglichkeiten der Validierer als auch die unrealistischen Erwartungen einzelner Anwender können dazu führen, dass das PDF/A-Konzept in Frage gestellt wird. Der Ruf nach einem "endgültigen Validator" wird daher immer lauter.

Das VeraPDF-Projekt

VeraPDF ist ein Projekt der Open Preservation Foundation. Es wurde als Konsortium zwischen den Partnern PDF Association, Dual Lab, The Digital Preservation Coalition und Keep Solutions gegründet. Ziel des Projekts ist die Entwicklung eines PDF/A-Validators. Die Entwicklungsarbeit wurde von PREFORMA ("PREservation FORMAts for Culture Information/E-Archives") ausgeschrieben, einem vorkommerziellen Beschaffungsprojekt (PCP), das vom FP7-ICT-Programm der EU mitfinanziert wurde. Der Open-Source-Validator von PREFORMA wird für drei Dateiformate eingesetzt - PDF sowie TIFF und ein Videoformat - und soll die Langzeitarchivierung in Gedächtnisinstitutionen unterstützen. VeraPDF hat den Auftrag für die ersten beiden Implementierungsphasen des PDF/A-Validators erhalten. Die erste Phase, die sich hauptsächlich mit der Festlegung der Spezifikationen des Validators befasste, ist nun abgeschlossen. Die zweite Phase, die Realisierung eines Prototyps, steht kurz vor dem Abschluss.

Bisher hat das Projekt gezeigt, dass es nicht so einfach ist, einen PDF/A-Validator von Grund auf zu entwickeln; es erfordert viel Erfahrung mit PDF. Aus politischen Gründen war es nicht möglich, einen der kommerziellen Validator-Hersteller mit dieser Aufgabe zu betrauen. Die Einbindung der PDF Association bietet den Vorteil, auf die Erfahrung des Herstellers zurückgreifen zu können und stellt sicher, dass die Entwicklung des Validierers von einer breiten Basis unterstützt wird.

Der Nachteil ist jedoch, dass die Arbeit sehr viel komplexer und langwieriger wird. Außerdem stehen für die vollständige Umsetzung des Projekts keine Mittel zur Verfügung, so dass die Hersteller versuchen, das Konzept durch eine Softwarearchitektur (Plug-ins) nutzbar zu machen.

Ein Vorteil, den das Projekt gegenüber kommerziellen Validierern hat, ist, dass der Validierer selbst "validiert" werden kann. Theoretisch wird dies dadurch ermöglicht, dass der gesamte Programmcode öffentlich gemacht wird. In der Realität schaut sich fast niemand den Code an. Deshalb versuchen die Hersteller, sich auf geeignete Testdateien zu konzentrieren. Allerdings ist es nicht verwunderlich, dass die Entwicklung der Testdateien genauso lange dauert wie die Entwicklung des Validators selbst. Die vorhandenen Testsuiten - wie z.B. Isartor, entwickelt von der PDF Association - reichen bei weitem nicht aus.

Zusammenfassung

Obwohl die neue PDF-Version kurz vor der Veröffentlichung steht, hat das VeraPDF-Projekt noch keine konkreten Ergebnisse für die Validierung von PDF/A-Dokumenten geliefert. Die Erfahrungen mit diesem Projekt beginnen die Gemeinschaft zu spalten und Enttäuschung macht sich breit. Viele Erwartungen werden nicht oder erst sehr spät erfüllt. So werden sich die Anwender wohl auf absehbare Zeit weiterhin auf kommerzielle Validierer verlassen müssen.

Gefällt Ihnen, was Sie sehen? Teilen Sie es mit einem Freund.

Grüezi! Wie können wir helfen?

Telefon