Glossar für alle Dinge im PDF-Format

Unser geliebtes portables Dokumentenformat (ja, dafür steht PDF) wird im Jahr 2021 30 Jahre alt. Und es ist im Laufe der Jahre immer leistungsfähiger geworden! Hier finden Sie Erklärungen zu den neuesten Begriffen und können sich an der Bewegung beteiligen.

AES - Advanced Encryption Standard (Erweiterter Verschlüsselungsstandard)

Symmetrische Verschlüsselungsmethode, die vom NIST als Standard veröffentlicht wurde.

Anmerkung

Verknüpft ein Objekt (z. B. eine Notiz, ein Musikstück oder einen Film) mit einer Position auf der Seite oder stellt eine Möglichkeit zur Interaktion mit dem Benutzer mit Hilfe von Maus und Tastatur dar.

Viele PDF-Dokumente sind so gestaltet, dass der Benutzer sie nicht verändern kann, aber dennoch durch die Verwendung von Formularfeldern und Kontrollkästchen interagieren kann.

Anti-Aliasing

Je nach Auflösung des Bildes kann es an den Rändern eines Objekts zu Verzerrungen oder Aliasing kommen.

Um diesen Effekt zu minimieren, können Anti-Aliasing-Methoden eingesetzt werden. Die Kanten werden mit angepassten Farbwerten durch rückwirkende Filterung geglättet.

Array-Objekt

Eine eindimensionale Sammlung von aufeinanderfolgenden Objekten mit impliziter Nummerierung, die bei 0 beginnt.

ASCII

American Standard Code for Information Interchange (Amerikanischer Standardcode für den Informationsaustausch), eine weit verbreitete Konvention für die binäre Kodierung eines bestimmten Satzes von 128 Zeichen. Der ASCII-Zeichensatz enthält das Leerzeichen (oder Blank) und die folgenden Zeichen

"#$%& '()*+,-. /0123456 789:;<=> ?@ABCDEF GHIJKLMN OPQRSTUV WXYZ[]^ _`abcdef ghijklmn opqrstuv wxyz~

ASN.1 - Abstract Syntax Notation #1

Beschreibungssprache für die Syntax digitaler Nachrichten. Für die binäre Verschlüsselung der Nachrichten eignen sich die Standards BER und DER von X.690.

BER - Basic Encoding Rules

Einfach zu handhabende Regeln für die binäre Verschlüsselung von digitalen Nachrichten.

Binäre Daten

Eine geordnete Sequenz von Bytes. Beispiele für Objekte, welche binär abgelegt werden, sind Bilder und Schriften.

Boolsches Objekt

Hierbei handelt es sich entweder um das Schlüsselwort 'wahr' (true) oder das Schlüsselwort 'falsch' (false).

Byte

Ein Byte ist eine Gruppe von 8 binären Ziffern (8 Bit), welche zusammen einen von 256 verschiedenen Werten repräsentieren können. Die 8 binären Ziffern werden heute in einer Vielzahl von elektronischen Geräten verwendet.

CA - Certification Authority

Akkreditierter Aussteller von Zertifikaten.

CAdES - CMS Advanced Electronic Signatures

Ein ETSI-Standard zur Standardisierung von CMS-basierten digitalen Signaturen.

Catalog

Das primäre Verzeichnisobjekt einer PDF Datei, welches die direkten oder indirekten Referenzen zu allen anderen Objekten des Dokumentes enthält, mit Ausnahme von Objekten des Anhangs (engl.: trailer). Diese sind nicht im Katalog referenziert.

Certificate

Ein Zertifikat ist eine elektronische Bestätigung der Identität einer natürlichen oder juristischen Person. Das Zertifikat enthält auch einen öffentlichen Schlüssel, für den nur die Person einen entsprechenden privaten Schlüssel besitzt. Mit diesem privaten Schlüssel kann die Person digitale Signaturen erzeugen. Jede Person kann diese Signatur mit Hilfe des Zertifikats überprüfen.

Character

Ein Byte, dessen Wert üblicherweise als Symbol innerhalb eines Symbolsets interpretiert wird, dessen Mitglieder 256 oder weniger zählen. Beispiele für Zeichen sind: 1, 2, a, b, A, &, etc.

Character set

Ein definierter Satz von Symbolen, in dem jedem Zeichen ein eindeutiger Byte-Wert zugeordnet ist. Beispiele für Zeichensätze sind:

  • ASCII

  • Unicode

CMS - Cryptographic Message Syntax

Nachrichtenformat für digitale Signaturen auf Basis von PKCS#7 mit der ASN.1-Syntax.

Conforming product

Software Applikation, welche sowohl ein konformes erzeugendes wie auch ein konformes verarbeitendes Programm ist.

Conforming reader

Software Applikation, welche eine PDF Datei, die zu einer Spezifikation wie z.B. [ISO 32000] oder [ISO 19005-1] konform ist, lesen und bearbeiten kann und die den Anforderungen eines konformen erzeugenden Programms entspricht.

Conforming writer

Software Applikation, welche PDF Dateien erzeugen kann, die konform zu einer Spezifikation sind, wie z.B. [ISO 32000] oder [ISO 19005-1].

Content stream

A datastream object whose data consists of a sequence of instructions that describe the graphic elements of a page.

Corrupt PDF file

Ein PDF Dokument, welches nicht korrekt ist, und dadurch u.U. unlesbar wird. Mögliche Ursachen sind:

  • Das Dokument wurde nicht korrekt erstellt.

  • Das Dokument wurde nachträglich beschädigt (z.B. unvollständiger Kopiervorgang).

CRL - Certificate Revocation List

Liste der widerrufenen Zertifikate, die vom Aussteller veröffentlicht wurden.

Cross-reference table

Datenstruktur, welche den Byte-Offset Startpunkt aller indirekten Objekte der Datei enthält.

DER - Distinguished Encoding Rules

Regeln für die binäre und eindeutige Kodierung von digitalen Nachrichten basierend auf BER.

Dictionary object

Eine assoziative Tabelle von Objektpaaren. Das erste Objekt ist der Objektname und fungiert als Schlüssel. Das zweite Objekt ist der Wert und kann eine beliebige Art von Objekt sein, inklusive eines anderen Verzeichnisses.

Direktes Objekt (direct object)

Jedes Objekt, welches nicht zu einem indirekten Objekt gemacht wurde.

DSA - Digital Signature Algorithm

von NIST

DSS (Cryptography) - Digital Signature Standard

von NIST

DSS (PDF) - Document Security Store

Struktur in einem PDF-Dokument, um Signaturvalidierungsinformationen wie CRLs, OCSPs und Zertifikate einzubetten.

eIDAS - Electronic Identification, Authentication and trust Services

Eine EU-Verordnung mit Standards für den elektronischen Transaktionen.

Elektronisches Dokument

Ist eine elektronische Repräsentation einer seitenorientierten Sammlung von Text, Bildern, grafischen Daten und Metadaten, welche hilfreich zum Identifizieren, Verstehen und Darstellen der Daten sind und ohne signifikanten Informationsverlust auf Papier reproduziert oder angezeigt werden können.

Encryption

Die Daten werden verschlüsselt, so dass Dritte ihre Bedeutung nicht erkennen können. Für die Kommunikation zwischen Sender und Empfänger generiert der Empfänger ein Schlüsselpaar aus einem privaten und einem öffentlichen Schlüssel. Wenn der Absender die Daten nun mit dem öffentlichen Schlüssel verschlüsselt, kann nur der Empfänger die Daten entschlüsseln, da der Empfänger alleiniger Eigentümer des privaten Schlüssels bleibt. Für die Verschlüsselung werden Algorithmen wie RSA mit Schlüssellängen von derzeit 2048 Bit verwendet. Die üblichen Verfahren für digitale Signaturen basieren auf dieser Technologie.

End–of–line marker (EOL marker)

Eine Sequenz von einem oder zwei Zeichen, welche das Ende einer Textzeile markiert, bestehend aus

  • einem CARRIAGE RETURN Zeichen (U+000D)

  • oder einem LINE FEED Zeichen (U+000A)

  • oder einem CARRIAGE RETURN direkt gefolgt von einem LINE FEED.

ETSI - European Telecommunications Standards Institute

Europäische Organisation für die Standardisierung digitaler Signaturen etc.

Filter

Ein optionaler Teil der Spezifikation eines Datenstromobjektes, welches beschreibt, wie die Daten des Datenstroms dekodiert werden sollten, bevor sie genutzt werden. Beispiele für Filter sind: Flate, DCT.

Font

Identifizierte Sammlung von Graphiken, welche Glyphen oder andere graphische Elemente sein können [ISO 15930-4].

Ein Schriftenprogramm (engl.: fontfile) definiert, wie Glyphen dargestellt werden. Ist ein Schriftenprogramm in einer PDF Datei enthalten, so ist die zugehörige Schrift eingebettet (engl.: embedded font).

Enthält die Schrift keinen vollständigen Zeichensatz, sondern z. B. nur die Glyphen der im Dokument verwendeten Zeichen, so redet man von einer Untergruppe (engl.: subsetted font).

Function

Ein spezieller Objekttyp, welcher eine parametrisierte Klasse repräsentiert, inklusive mathematischen Formeln und gesampelten Repräsentationen von beliebiger Auflösung.

Gauss Filter

Filter, welcher in der Bildbearbeitung Bildrauschen durch Glättung oder Weichzeichnen vermindern kann.

Glyph

Erkennbares abstraktes grafisches Symbol, unabhängig von jeglichem spezifischen Design [ISO/IEC 9541-1]. Beispiele von Glyphen des Zeichens "A" sind: A, A, A

Grafikzustand (graphic state)

Das oberste Element eines Stapelspeichers enthält die Parameter zur Steuerung der grafischen Darstellung. Der Grafikzustand enthält Informationen wie z.B. Farbe, Schrift, Schriftgrösse, aktuelle Transformationsmatrix, etc.

Hash

Ein Hash-Wert (kurz Hash) ist eine Zahl, die aus einer beliebigen Menge von Daten wie Dokumenten, Zertifikaten, Nachrichten usw. berechnet wird. Diese Zahl ist oft viel kürzer als die Originaldaten (einige Bytes). Der Hash-Wert hat das Merkmal, dass er für die gleichen Daten gleich ist und für verschiedene Daten mit ziemlicher Sicherheit eindeutig ist. Die Originaldaten können auch nicht aus dem Hash-Wert ermittelt werden. Für die Berechnung werden Hash-Algorithmen wie SHA-1 oder SHA-2 verwendet.

Hinting

Hinting ist ein Verfahren, welches die Darstellungsqualität von Schriften verbessert, indem die Umrisse bei der Darstellung von Schriftzeichen optimiert wird.

HSM - Hardware Security Module

Gerät zur sicheren Speicherung privater Schlüssel sowie zur Verschlüsselung, Entschlüsselung oder Erstellung digitaler Signaturen und zur effizienten und sicheren Implementierung von Verschlüsselungs- und Signaturalgorithmen.

ICC Profile

Farbprofil konform zur ICC Spezifikation [ISO 15076-1:2005].

Indirektes Objekt

Ein Objekt, welches mit einem positiven Integer Objekt bezeichnet ist, gefolgt von einer nicht-negativen Integer Generationsnummer und obj. Beendet wird es mit endobj.

Integer object

Mathematischer Integer derart implementiert, dass 0 das Zentrum des Intervals bildet. Die Zahl kann ein- oder mehrstellig sein und optional ein Vorzeichen haben.

Interpolation

Verfahren, welches in der Bildbearbeitung das Zusammenspiel von Pixeldichte und Farbtiefe in Rastergrafiken regelt. Die bilineare Interpolation ist eine Erweiterung für die Skalierung und Darstellung von Texturen bei gerenderten Bildern.

ISO - International Standards Organisation

Internationale Organisation für die Standardisierung von PDF und PDF/A, etc. Die Schweiz ist in der ISO durch die Schweizerische Normen-Vereinigung (SNV) vertreten.

ISO 19005

Siehe PDF/A.

ISO 32000

Siehe PDF.

ISO/IEC 18014

ISO-Norm für Zeitstempeldienste

ITU-T - ITU Telecommunication Standardization Sector

Koordiniert Standards für Telekommunikation und ist einer von drei Sektoren der ITU (International Telecommunication Union).

Key

Daten zum Verschlüsseln / Entschlüsseln einer Nachricht. In einem Kryptosystem mit öffentlichem Schlüssel gibt es ein Paar eines privaten und eines öffentlichen Schlüssels.

LTV - Long-Term Validation

Erweiterung der digitalen Signaturen um zusätzliche Daten, so dass eine langfristige Überprüfbarkeit ohne Online-Dienste möglich ist. Die zusätzlichen Daten bestehen aus der Vertrauenskette der Zertifikate vom Inhaberzertifikat bis zum Stammzertifikat des Ausstellers sowie Informationen, die die Gültigkeit der Zertifikate zum Zeitpunkt der Signatur nachweisen.

MDP - Modification Detection and Prevention Signature

Ermöglicht die Erkennung von nicht erlaubten Änderungen, die vom Autor angegeben wurden. Ein Dokument kann nur eine MDP-Signatur enthalten, welche die erste im Dokument sein muss. Andere Arten von Unterschriften können vorhanden sein.

Multiple Master Fonts

Variation des Postscript-Type1-Formates, welche die Möglichkeit von beliebigen Darstellungsvariationen einer Schriftart zulassen. Zusätzlich zu den üblichen Ausprägungen können z.B. Strichstärke und Proportionen angepasst werden.

Name object

Ein atomares Symbol, einzigartig definiert durch eine Zeichensequenz, welche mit einem Querstrich (/, U+002F) beginnt. Der Querstrich ist jedoch nicht Teil des Namens.

Name tree

Ähnlich einem Verzeichnis, welches Schlüssel und Werte assoziiert. Doch die Schlüssel im Namensbaum sind Strings und geordnet.

NIST - National Institute of Standards and Technology

Die United States Federal Agency ist für die Standardisierungsprozesse zuständig.

Null object

Ein einzelnes Objekt vom Typ null, bezeichnet durch das Schlüsselwort null, dessen Typ und Wert verschieden zu allen anderen Objekten ist.

Number tree

Ähnlich einem Verzeichnis, welches Schlüssel und Werte assoziiert. Die Schlüssel im Zahlenbaum sind Integer und geordnet.

Numeric object

Entweder ein Integer Objekt oder ein Reelles Objekt.

OASIS/DSS - Organization for the Advancement of Structured Information Standards /Digital Signing Services

Ein Standard der OASIS-Organisation für Signaturdienste basierend auf der XML-Syntax.

Object

Eine Grunddatenstruktur, anhand derer PDF Dateien konstruiert werden. Ein Objekt kann von folgendem Typ sein: Array, Boolsch, Verzeichnis, Integer, Name, null, Reell, Datenstrom oder String.

Object reference

Ein Objektwert, der erlaubt, ein Objekt mit einem anderen zu referenzieren. Sie hat die Form "<n> <m> R", wobei <n> eine indirekte Objektnummer ist, <m> dessen Versionsnummer, und R ist der Grossbuchstabe R.

Object stream

Ein Datenstrom, welcher eine Sequenz von PDF Objekten enthält.

OCR

Texterkennung oder auch Optische Zeichenerkennung (englische Abkürzung OCR von englisch optical character recognition, selten auch: OZE) ist ein Begriff aus der Informationstechnik und bezeichnet die automatisierte Erkennung von Text innerhalb von Bildern.

OCSP - Online Certificate Status Protocol

Protokoll zur Online-Abfrage des Gültigkeitsstatus eines bestimmten Zertifikats basierend auf der ASN.1-Syntax.

PAdES - PDF Advanced Electronic Signature Profiles

Ein ETSI-Standard für den Aufbau von CMS-Signaturen und deren Einbettung in PDF Dokumente.

PDF

Ein von ISO (ISO-32000) standardisiertes Dateiformat für den Dokumentenaustausch. Für häufige PDF Anwendungen gibt es spezielle Unterstandards wie PDF/A (ISO-19005) zur Archivierung digitaler Dokumente.

PDF/A

Portable Document Format für Archivierung, definiert in [ISO 19005]. Beschreibt die Anforderungen an PDF Dokumente, um den Normen PDF/A-1a und PDF/A-1b zu entsprechen. Die grundsätzlichen Anforderungen an PDF/A-1b sind:

  • Konformität mit PDF Version 1.4

  • Einbettung aller Schriften, welche für sichtbaren Text verwendet werden.

  • Einbettung von Farbprofilen, wenn der verwendete Farbraum dies vorschreibt.

  • Keine Verschlüsselung

  • Keine Transparenz

Bei PDF/A-1a gilt zusätzlich:

  • Kodierung von Text als UNICODE

  • Es muss eine strukturelle Information vorliegen (Tagging).

PIN - Personal Identification Number

Geheimcode, welcher für den Zugriff auf ein Token benötigt wird.

PKCS - Public Key Cryptography Standards

Eine Reihe von proprietären Standards von RSA Security Incorporated. Die häufigsten Standards sind: Verschlüsselung von Signaturen (PKCS#1), Nachrichtenformat für Signaturen (PKCS#7), Schnittstelle zu Token (PKCS#11) und Dateiformat für Schlüssel und Zertifikate (PKCS#12).

PKI - Public Key Infrastructure

Ein System, das ein Paar eines privaten und eines öffentlichen Schlüssels erstellt, speichert und verifiziert.

QES

Qualifizierte elektronische Signatur

Real object

Approximiert mathematische reelle Zahlen, doch mit limitiertem Wertebereich und Präzision. Geschrieben wird es als eine oder mehrere Ziffern mit einem optionalen Vorzeichen und einem optionalen Dezimalpunkt.

Rectangle

Ein spezifisches Array-Objekt, welches die Position und die Zeichenboxen (engl.: bounding boxes) einer Seite für verschiedene Objekte beschreibt. Es wird dargestellt als Array von 4 Zahlen, welche die Koordinatenpaare von zwei diagonal gegenüberliegenden Ecken bezeichnen, üblicherweise in der Form [unten links X, Y, oben rechts X, Y].

Resource dictionary

Assoziiert Ressourcen mit Namen. Es wird in Inhaltsdatenströmen verwendet und enthält die Resourcen Objekte, welche es in verschiedene Kategorien (z.B. Schrift, Farbraum, Pattern) organisiert.

Signature, signing

Daten mit denen die Integrität und optional die Authentizität eines Dokuments gewährleistet werden kann. Die Signatur erfolgt im Wesentlichen wie folgt: Der Hash-Wert wird aus den zu signierenden Daten gebildet und mit dem privaten Schlüssel verschlüsselt.Die Signatur wird zusammen mit Zertifikaten und anderen Informationen in eine CMS-Nachricht verpackt.

Space character, white-space character

Textzeichen, welches verwendet wird, um den orthografischen Leerschlag zu repräsentieren. Dazu gehören folgende Zeichen:

  • HORIZONTAL TABULATION (U+0009)

  • LINE FEED (U+000A)

  • VERTICAL TABULATION (U+000B)

  • FORM FEED (U+000C)

  • CARRIAGE RETURN (U+000D)

  • SPACE (U+0020)

  • NOBREAK SPACE (U+00A0)

  • EN SPACE (U+2002)

  • EM SPACE (U+2003)

  • FIGURE SPACE (U+2007)

  • PUNCTUATION SPACE (U+2008)

  • THIN SPACE (U+2009)

  • HAIR SPACE (U+200A)

  • ZERO WIDTH SPACE (U+200B)

  • IDEOGRAPHIC SPACE (U+3000)

Stream object

Besteht aus einem Verzeichnis, gefolgt von keinem oder mehreren Bytes, geklammert zwischen den Schlüsselwörtern 'stream' und 'endstream'.

String object

Besteht aus einer Serie von Bytes (vorzeichenlose Integerwerte im Wertebereich von 0 bis 255). Die Bytes sind keine Integer Objekte, sondern in einer kompakteren Form gespeichert.

TLS - Transport Layer Security

Weiterentwicklung von Secure Sockets Layer (SSL), einem hybriden Verschlüsselungsprotokoll für die sichere Datenübertragung im Internet.

Token

Ein "Container" (Teil des HSM, USB-Stick, Smartcard, etc.), der private Schlüssel enthält und vor unbefugtem Zugriff schützt. Aus praktischen Gründen enthält der Token oft auch entsprechende Zertifikate und öffentliche Schlüssel, die nicht geschützt werden müssen.

Transparency

In einer PDF-Datei werden Grafikobjekte nacheinander auf eine Seite aufgebracht, wobei jedes Objekt mit dem bereits vorhandenen Hintergrund zusammengesetzt wird. Dieser Hintergrund ist zunächst nur die leere Seite und besteht in späteren Schritten aus allen bis dahin hinzugefügten Objekten. Zusätzlich zu den Objekten definiert eine Seite einen Compositing-Modus für jedes Objekt. Je nach Modus verschmilzt der Hintergrund entweder transparent mit dem neuen Objekt oder er wird undurchsichtig abgedeckt. Im Allgemeinen lässt sich das Vorhandensein oder Nichtvorhandensein von Transparenz auf einer PDF-Seite nicht leicht von Hand feststellen. Bestimmte Transparenzen sind jedoch bei der Arbeit mit PDF/A-1-Formaten nicht zulässig, so dass die Konvertierung einer PDF-Datei mit Transparenz in eine PDF/A-1-Datei visuelle Unterschiede verursachen kann. Die Standards PDF/A-2, A-3 und A-4 hingegen erlauben Transparenz.

TSA - Time Stamp Authority

Akkreditierter Anbieter von Zeitstempeldiensten.

TSP - Time Stamp Protocol

Protokoll für den Online-Abruf von kryptographischen Zeitstempeln basierend auf der ASN.1-Syntax.

Unicode

Internationaler Standard, in dem jedem sinntragenden Schriftzeichen oder Textelement ein eindeutiger Wert zugewiesen wird. Praktisch bedeutungsgleich dazu ist der Universal Character Set [ISO 10646].

Verification, verifying

Gültigkeitsprüfung einer digitalen Signatur. Eine Signatur wird wie folgt verifiziert: Die Signatur wird mit dem öffentlichen Schlüssel entschlüsselt. Der in der Signaturnachricht enthaltene Hash-Wert wird mit dem aus den signierten Daten berechneten Hash-Wert verglichen. Wenn die Hashes übereinstimmen, ist die Signatur gültig.

Version

Kennzeichnet, anhand welcher PDF Referenz das Dokument erzeugt wurde. Die verarbeitende PDF Software muss diese Version unterstützen, um eine korrekte Verarbeitung zu gewährleisten. PDF Versionen gehen von 1.0 bis 1.8 (Stand 2009). PDF 1.4 entspricht Acrobat 5, PDF 1.8 entspricht Acrobat 9.

Web capture

Bezeichnet den Prozess der Erzeugung von PDF Inhalt durch Importieren und möglicherweise Konvertieren von Dateien aus dem Internet oder lokalen Dateien. Die Dateien können in einem beliebigen Format importiert werden, wie z.B. HTML, GIF, JPEG, Text und PDF.

WebAssembly

WebAssembly (häufig abgekürzt mit «Wasm») ist ein portables Datenformat für Binärcode, der in einer geeigneten Laufzeitumgebung ausgeführt werden kann, zum Beispiel in einem Web-Browser. Im Gegensatz zu JavaScript liegt der Code in stark optimierter, Hardware-naher Binärform vor, was einen deutlichen Performancevorteil bietet. Das W3C (World Wide Web Consortium) lancierte den Standard 2017 mit dem Ziel, die Vorgängertechnologie asm.js zu abstrahieren, optimieren und breiter abzustützen. Da WebAssembly ein Kompilations-Target ist, können unterschiedliche Programmiersprachen verwendet werden.

X.509

ITU-T Standard für eine Public-Key-Infrastruktur zur Erstellung digitaler Zertifikate auf Basis der ASN.1-Syntax.

X.690

ITU-T Standard zur Kodierung digitaler Nachrichten basierend auf der ASN.1-Syntax: Basic Encoding Rules (BER), Canonical Encoding Rules (CER) and Distinguished Encoding Rules (DER).

XAdES - XML Advanced Electronic Signatures

Ein ETSI-Standard für die Erstellung von Signaturen und deren Einbettung in XML-Daten.

XML - Extensible Markup Language

Format für den Austausch von hierarchisch strukturierten Daten in Textform zwischen Maschinen.

XMP packet

Strukturierter Wrapper für serialisierte XML Metadaten, welche als verschiedene Dateiformate eingebettet werden können.