PDF/A-Dateien komprimieren, ohne die Konformität zu gefährden

Compressing PDF/A Files Without Breaking Conformance

Wer an Dateikomprimierung denkt, stellt sich in der Regel einen einzigen Vorgang vor. Aus Nutzerperspektive stimmt das auch, doch im Hintergrund laufen dabei mehrere Prozesse gleichzeitig ab. Da die Komprimierung meist am Ende des Dokumenten-Workflows steht, wird sie häufig als nachrangiger Schritt behandelt, ohne dass der konkrete Ansatz dabei hinterfragt wird. Je nach Vorgehensweise und den geforderten Dateigrößen können Metadaten entfernt, Bilder in ihrer Qualität reduziert und generell alle Daten gelöscht werden, die als unnötig oder redundant gelten.

In den meisten Fällen ist dieser Prozess unkritisch. Bei Archivdokumenten und PDF/A-Dateien im Besonderen können die strikten Konformitätsanforderungen die Komprimierung jedoch zur Herausforderung machen. Wenn eine Bank beispielsweise KYC-Dokumente für die Langzeitarchivierung vorbereitet und dabei eingebettete Schriftarten entfernt, um die Dateigröße zu reduzieren, ist die resultierende Datei nicht mehr PDF/A-konform — was regulatorisches Risiko erzeugt. Ob Sie eine bestehende PDF/A-Datei komprimieren oder eine Datei sowohl in PDF/A konvertieren als auch komprimieren müssen: Die Validierung darf dabei nicht übergangen werden. Dateien, die als PDF/A deklariert sind, aber die PDF/A-Standards nicht vollständig erfüllen, halten einer regulatorischen Prüfung nicht stand, insbesondere wenn der Fehler durch eine Validierung hätte erkannt und verhindert werden können.

Typische Probleme bei der Komprimierung von Archiv-PDFs

Bei der Erstellung und Komprimierung von PDF/A-Dateien für Archivzwecke gibt es einige spezifische Fallstricke, die immer wieder auftreten:

Digitale Signaturen ungültig machen

Wenn ein Dokument digital signiert werden muss oder bereits signiert wurde, ist die Reihenfolge der Arbeitsschritte die entscheidende Frage im Workflow. Komprimierung verändert zwangsläufig die Bytes, auf die die Verifizierungsprüfsumme der Signatur verweist, und unterbricht damit die kryptografische Verifikation, sodass die Signatur ihre Gültigkeit verliert.


Es gibt schlicht keine Möglichkeit, ein signiertes Dokument zu komprimieren und dabei die kryptografische Integrität der Signatur zu wahren. Das bedeutet: Die einzige Lösung besteht darin, das Dokument vor der Signierung zu komprimieren, oder zu akzeptieren, dass ein bereits signiertes Dokument nicht weiter komprimiert werden kann.

Datenverlust durch Bildkomprimierung

Bildkomprimierung erfolgt typischerweise durch erneutes Komprimieren mit einem leistungsfähigeren Algorithmus, durch Absenkung der Qualitätsstufe verlustbehafteter Algorithmen oder durch Downsampling, bei dem die Pixelanzahl und damit die Auflösung des Bildes reduziert werden. In jedem Fall kann ein zu stark komprimiertes Bild unleserlich werden. Das ist besonders problematisch bei Archivdokumenten mit wichtigen Bildinhalten, etwa medizinischen Aufnahmen oder Unfallfotos.

PDF/A ist darauf ausgelegt, sicherzustellen, dass Dokumente noch Jahrzehnte später renderbar und visuell identisch sind. Komprimierung, die die Bildqualität mindert, untergräbt diese Kerngarantie des Formats und kann zudem gegen gesetzliche Vorschriften verstoßen. Die deutschen GoBD-Vorschriften gelten für alle Unternehmen, die der kaufmännischen Buchführungspflicht unterliegen, und verlangen, dass archivierte Dokumente keine Artefakte oder Bildverzerrungen enthalten, die die Lesbarkeit beeinträchtigen.


Darüber hinaus müssen digitalisierte Dokumente dem Erscheinungsbild der Originale entsprechen, einschließlich der Farbtreue. Nachträgliche Komprimierungsmethoden, die die Bildqualität verschlechtern, verstoßen direkt gegen diese Anforderungen. Die GoBD schreibt außerdem vor, dass Lesbarkeit über die gesamte Aufbewahrungsfrist gewährleistet sein muss (für die meisten Unternehmen 6 bis 10 Jahre, in bestimmten Branchen länger). Ein Archiv, das die GoBD-Bildqualitätsanforderungen bereits am ersten Tag nicht erfüllt, ist für die gesamte Aufbewahrungsdauer nicht konform.


Die gute Nachricht: Mit dem richtigen Ansatz lassen sich Dokumente komprimieren und dabei Lesbarkeit sowie Konformität erhalten. Unser SDK bietet granulare DPI-Steuerung (konfigurierbar bis auf DPI-Schwellenwerte und Zielauflösung), und das MRC-Profil wurde speziell für gescannte Dokumente mit hohem Textanteil entwickelt, etwa Schadenformulare, Unfallberichte und KYC-Dokumente.

Unabhängig von der konkreten Reihenfolge der Arbeitsschritte ist es unerlässlich, Dokumente am Ende des Workflows vor der Archivierung zu validieren und die Originaldokumente so lange aufzubewahren, bis die komprimierten Versionen erfolgreich validiert wurden. Wird das Profil "Minimale Dateigröße" auf ein 150-DPI-gescanntes Schadenformular angewendet, ist der Schaden irreversibel: Aus der komprimierten Datei lässt sich die ursprüngliche Qualität nicht wiederherstellen. Die Originaldatei müsste erneut verarbeitet werden. Auch deshalb sollte eine Originaldatei niemals gelöscht werden, bevor die komprimierte Version validiert ist.

PDF/A-Konformität nicht gefährden

Neben den genannten Problemen besteht das übergeordnete Risiko, durch Komprimierung die PDF/A-Konformität zu verletzen. Eine echte PDF/A-Datei muss eine Validierung bestehen, die unter anderem prüft, ob alle Schriftarten eingebettet sind, alle Farben korrekt definiert sind und keine unzulässigen Funktionen enthalten sind, wie Verschlüsselung, interaktive Inhalte oder Medien. Wenn der Komprimierungsprozess eingebettete Schriftarten entfernt, Farbprofile verändert oder andere Aspekte betrifft, die den strikten PDF/A-Anforderungen unterliegen, ist die resultierende Datei nicht mehr PDF/A-konform und sieht in den meisten Fällen auch visuell anders aus.


Solche Fehler entstehen, wenn Teams allgemeine Komprimierungstools einsetzen und weder das Team noch das Tool über vollständiges Wissen zu den PDF/A-Konformitätsanforderungen verfügen.


Der sicherste Weg ist, die Datei zunächst zu komprimieren (sorgfältig, ohne Schriftarten zu entfernen) und sie anschließend in PDF/A zu konvertieren. Unser SDK bietet jedoch ein Archive-Profil, das speziell entwickelt wurde, um Dateien mit bestehender PDF/A-Konformität zu komprimieren und dabei konform zu bleiben, etwa durch das Beibehalten eingebetteter Schriftarten. Auch wenn keine PDF/A-Konformität erforderlich ist, eignet sich das Archive-Profil hervorragend, um normale PDFs verlustarm zu komprimieren.

Komprimierungsunterschiede zwischen den PDF/A-Typen

Es gibt verschiedene PDF/A-Typen, und jeder bringt eigene Überlegungen zur Komprimierung mit sich.

PDF/A-1 ist das ursprüngliche PDF/A-Format, basiert auf PDF 1.4 und hat die strengsten Konformitätsanforderungen aller PDF/A-Typen. PDF/A-1 wird in stark regulierten Branchen und Behörden am häufigsten anerkannt, bietet jedoch die eingeschränktesten Komprimierungsoptionen. So ist JPEG-2000-Bildkomprimierung in PDF/A-1 nicht zulässig, da JPEG 2000 erst mit PDF 1.5 eingeführt wurde, also nach der Verabschiedung des PDF/A-1-Standards. In PDF/A-2 und PDF/A-3 ist JPEG-2000-Komprimierung hingegen erlaubt, da diese Standards später entstanden sind. PDF/A-1 verbietet außerdem Transparenz, was bedeutet, dass ein Originaldokument mit Transparenz nach der Konvertierung zu PDF/A-1 anders aussehen wird.

PDF/A-2 bietet verbesserte Komprimierungsmöglichkeiten innerhalb der Konformitätsvorgaben. Die Liste zulässiger Komprimierungstypen wurde um JPEG 2000 erweitert, und die Dateigröße lässt sich durch komprimierte Objekt- und XRef-Streams weiter reduzieren. Wenn die Dateigröße das primäre Ziel ist, ist PDF/A-2 häufig das richtige Archivierungsformat, auch wenn dabei weitere Faktoren zu berücksichtigen sind, etwa die spezifischen Vorschriften der jeweiligen Branche oder des Landes.

PDF/A-3 ermöglicht das Einbetten zusätzlicher Dateien in beliebigen Formaten, während PDF/A-2 nur bestimmte Dateitypen erlaubt. Deutschlands hybrides Rechnungsformat ZUGFeRD etwa enthält neben dem PDF einen XML-Anhang, der den Dateigrößen-Overhead kaum erhöht und die Maschinenlesbarkeit verbessert.

Grundsätzlich dreht sich die Frage, welcher PDF/A-Typ für Komprimierungszwecke zu wählen ist, meist um die Entscheidung zwischen PDF/A-1 und PDF/A-2. PDF/A-3 kommt nur dann ins Spiel, wenn Anhänge zwingend erforderlich sind; in solchen Fällen ist die Komprimierung üblicherweise ein nachrangiges Thema. In den meisten Fällen ist PDF/A-2 eine solide Wahl, da es bessere Komprimierungsoptionen mit Funktionen kombiniert, die PDF/A-1 fehlen, darunter Transparenzunterstützung.

Den richtigen Workflow für die PDF-Archivierung wählen

Im Wesentlichen gibt es zwei Szenarien, in denen diese Fragen rund um die PDF/A-Komprimierung relevant werden:

  1. Ein Standard-PDF muss vor der Archivierung sowohl komprimiert als auch in das PDF/A-Format konvertiert werden.

  2. Ein bereits im PDF/A-Format vorliegendes Dokument muss vor der Archivierung komprimiert werden.

Im ersten Szenario empfiehlt es sich, zunächst zu komprimieren und erst anschließend in PDF/A zu konvertieren und zu validieren. Durch das vorherige Komprimieren schützen Sie die Ausgangsqualität und vermeiden Komplikationen nach der Archivierung. Wird ein bildlastiges Dokument erst nach der Konvertierung zu PDF/A aggressiv komprimiert, kann die Bildqualität irreversibel sinken. Das Dokument ist dann zwar PDF/A-konform, verstößt aber möglicherweise dennoch gegen Vorschriften, die die Lesbarkeit von Bildmaterial in Archivdokumenten fordern.

Im zweiten Szenario muss die Datei so komprimiert werden, dass die PDF/A-Konformität erhalten bleibt. Hier sind spezifische Komprimierungsprofile unerlässlich, die innerhalb der PDF/A-Konformitätsanforderungen arbeiten. Verwenden Sie das Archive-Profil, um die Dateigröße zu reduzieren und dabei die PDF/A-Konformität zu wahren. Wenn Sie dem eingehenden Dokument nicht vertrauen, kann es sinnvoll sein, es vor der Anwendung des Archive-Profils zunächst zu validieren.

Wenn Sie unser SDK in Aktion sehen möchten, können Sie es noch heute testen. Es liefert schnelle und präzise Ergebnisse, auch bei großen Dokumentenmengen, bietet Entwickler-Tooling für die Integration in bestehende Unternehmenssysteme und wird täglich von unseren Kunden in den Bereichen Banking, Versicherung, Behörden und anderen regulierten Branchen eingesetzt. Bei Fragen zur Implementierung in Ihrem Unternehmen kontaktieren Sie uns

Gefällt Ihnen, was Sie sehen? Teilen Sie es mit einem Freund.