PDF Tools


PDF Glossar

Annotation

Assoziiert ein Objekt, wie z. B. eine Notiz, Musik oder Film mit einer Position auf der Seite, oder stellt eine Möglichkeit dar, um mit dem Benutzer mit Hilfe von Maus und Tastatur zu interagieren.
Viele PDF Dokumente sind so konzipiert, dass der Benutzer den Seiteninhalt nicht verändern darf, sondern nur mit Annotationen interagieren kann, z. B. Formularfeldern und Checkboxen.

Array Objekt (array object)

Eine eindimensionale Kollektion von sequenziellen Objekten mit implizierter Nummerierung, beginnend bei 0.

ASCII

Der Amerikanische Standard Code für Informationsaustausch (engl.: American Standard Code for Information Interchange) ist eine weit verbreitete Konvention, um ein spezifisches Set von 128 Zeichen binär zu kodieren. Im ASCII Zeichensatz sind das Leerzeichen sowie folgende Zeichen enthalten: "#$%& '()*+,-. /0123456 789:;<=> ?@ABCDEF GHIJKLMN OPQRSTUV WXYZ[\]^ _`abcdef ghijklmn opqrstuv wxyz{|}~

Binäre Daten

Eine geordnete Sequenz von Bytes. Beispiele für Objekte, welche binär abgelegt werden, sind Bilder und Schriften.

Boolsches Objekt

Hierbei handelt es sich entweder um das Schlüsselwort 'wahr' (true) oder das Schlüsselwort 'falsch' (false).

Byte

Ein Byte ist eine Gruppe von 8 binären Ziffern (8 Bit), welche zusammen einen von 256 verschiedenen Werten repräsentieren können. Die 8 binären Ziffern werden heute in einer Vielzahl von elektronischen Geräten verwendet.

Direktes Objekt (direct object)

Jedes Objekt, welches nicht zu einem indirekten Objekt gemacht wurde.

Elektronisches Dokument

Ist eine elektronische Repräsentation einer seitenorientierten Sammlung von Text, Bildern, grafischen Daten und Metadaten, welche hilfreich zum Identifizieren, Verstehen und Darstellen der Daten sind und ohne signifikanten Informationsverlust auf Papier reproduziert oder angezeigt werden können.

Filter

Ein optionaler Teil der Spezifikation eines Datenstromobjektes, welches beschreibt, wie die Daten des Datenstroms dekodiert werden sollten, bevor sie genutzt werden. Beispiele für Filter sind: Flate, DCT.

Funktion

Ein spezieller Objekttyp, welcher eine parametrisierte Klasse repräsentiert, inklusive mathematischen Formeln und gesampelten Repräsentationen von beliebiger Auflösung.

Glyph

Erkennbares abstraktes grafisches Symbol, unabhängig von jeglichem spezifischen Design [ISO/IEC 9541-1]. Beispiele von Glyphen des Zeichens "A" sind: A, A, A

Grafikzustand (graphic state)

Das oberste Element eines Stapelspeichers enthält die Parameter zur Steuerung der grafischen Darstellung. Der Grafikzustand enthält Informationen wie z.B. Farbe, Schrift, Schriftgrösse, aktuelle Transformationsmatrix, etc.

ICC Profil

Farbprofil konform zur ICC Spezifikation [ISO 15076-1:2005].

Indirektes Objekt

Ein Objekt, welches mit einem positiven Integer Objekt bezeichnet ist, gefolgt von einer nicht-negativen Integer Generationsnummer und obj. Beended wird es mit endobj.

Inhaltdatenstrom (content stream)

Ein Datenstrom-Objekt, dessen Daten aus einer Sequenz von Instruktionen besteht, welche die zu zeichnenden grafischen Elemente der Seite beschreiben.

Integer Object

Mathematischer Integer derart implementiert, dass 0 das Zentrum des Intervals bildet. Die Zahl kann ein- oder mehrstellig sein und optional ein Vorzeichen haben.

ISO 19005

Siehe PDF/A.

ISO 32000

Siehe PDF.

Katalog (catalog)

Das primäre Verzeichnisobjekt einer PDF Datei, welches die direkten oder indirekten Referenzen zu allen anderen Objekten des Dokumentes enthält, mit Ausnahme von Objekten des Anhangs (engl.: trailer). Diese sind nicht im Katalog referenziert.

Konformes erzeugendes Programm (conforming reader)

Software Applikation, welche eine PDF Datei, die zu einer Spezifikation wie z.B. [ISO 32000] oder [ISO 19005-1] konform ist, lesen und bearbeiten kann und die den Anforderungen eines konformen erzeugenden Programms entspricht.

Konformes Produkt (conforming product)

Software Applikation, welche sowohl ein konformes erzeugendes wie auch ein konformes verarbeitendes Programm ist.

Konformes verarbeitendes Programm (conforming writer)

Software Applikation, welche PDF Dateien erzeugen kann, die konform zu einer Spezifikation sind, wie z.B. [ISO 32000] oder [ISO 19005-1].

Korrupte PDF Datei

Ein PDF Dokument, welches nicht korrekt ist, und dadurch u.U. unlesbar wird. Mögliche Ursachen sind:

  • Das Dokument wurde nicht korrekt erstellt.
  • Das Dokument wurde nachträglich beschädigt (z.B. unvollständiger Kopiervorgang).

Leerzeichen (space character, white-space character)

Textzeichen, welches verwendet wird, um den orthografischen Leerschlag zu repräsentieren. Dazu gehören folgende Zeichen:

  • HORIZONTAL TABULATION (U+0009)
  • LINE FEED (U+000A)
  • VERTICAL TABULATION (U+000B)
  • FORM FEED (U+000C)
  • CARRIAGE RETURN (U+000D)
  • SPACE (U+0020)
  • NOBREAK SPACE (U+00A0)
  • EN SPACE (U+2002)
  • EM SPACE (U+2003)
  • FIGURE SPACE (U+2007)
  • PUNCTUATION SPACE (U+2008)
  • THIN SPACE (U+2009)
  • HAIR SPACE (U+200A)
  • ZERO WIDTH SPACE (U+200B)
  • IDEOGRAPHIC SPACE (U+3000)

Namen Objekt

Ein atomares Symbol, einzigartig definiert durch eine Zeichensequenz, welche mit einem Querstrich (/, U+002F) beginnt. Der Querstrich ist jedoch nicht Teil des Namens.

Namenbaum (name tree)

Ähnlich einem Verzeichnis, welches Schlüssel und Werte assoziiert. Doch die Schlüssel im Namensbaum sind Strings und geordnet.

null Objekt

Ein einzelnes Objekt vom Typ null, bezeichnet durch das Schlüsselwort null, dessen Typ und Wert verschieden zu allen anderen Objekten ist.

Numerisches Objekt

Entweder ein Integer Objekt oder ein Reelles Objekt.

Objekt

Eine Grunddatenstruktur, anhand derer PDF Dateien konstruiert werden. Ein Objekt kann von folgendem Typ sein: Array, Boolsch, Verzeichnis, Integer, Name, null, Reell, Datenstrom oder String.

Objekt Referenz

Ein Objektwert, der erlaubt, ein Objekt mit einem anderen zu referenzieren. Sie hat die Form "<n> <m> R", wobei <n> eine indirekte Objektnummer ist, <m> dessen Versionsnummer, und R ist der Grossbuchstabe R.

Objektdatenstrom (object stream)

Ein Datenstrom, welcher eine Sequenz von PDF Objekten enthält.

PDF

Portable Document Format Dateiformat, definiert in [ISO 32000].

PDF/A

Portable Document Format für Archivierung, definiert in [ISO 19005]. Beschreibt die Anforderungen an PDF Dokumente, um den Normen PDF/A-1a und PDF/A-1b zu entsprechen. Die grundsätzlichen Anforderungen an PDF/A-1b sind:

  • Konformität mit PDF Version 1.4
  • Einbettung aller Schriften, welche für sichtbaren Text verwendet werden.
  • Einbettung von Farbprofilen, wenn der verwendete Farbraum dies vorschreibt.
  • Keine Verschlüsselung
  • Keine Transparenz

Bei PDF/A-1a gilt zusätzlich:

  • Kodierung von Text als UNICODE
  • Es muss eine strukturelle Information vorliegen (Tagging).

Querverweistabelle (cross reference table)

Datenstruktur, welche den Byte-Offset Startpunkt aller indirekten Objekte der Datei enthält.

Reelles Objekt (real object)

Approximiert mathematische reelle Zahlen, doch mit limitiertem Wertebereich und Präzision. Geschrieben wird es als eine oder mehrere Ziffern mit einem optionalen Vorzeichen und einem optionalen Dezimalpunkt.

Rechteck (rectangle)

Ein spezifisches Array-Objekt, welches die Position und die Zeichenboxen (engl.: bounding boxes) einer Seite für verschiedene Objekte beschreibt. Es wird dargestellt als Array von 4 Zahlen, welche die Koordinatenpaare von zwei diagonal gegenüberliegenden Ecken bezeichnen, üblicherweise in der Form [unten links X, Y, oben rechts X, Y].

Ressourcenverzeichnis (resource dictionary)

Assoziiert Ressourcen mit Namen. Es wird in Inhaltsdatenströmen verwendet und enthält die Resourcen Objekte, welche es in verschiedene Kategorien (z.B. Schrift, Farbraum, Pattern) organisiert.

Schrift (font)

Identifizierte Sammlung von Graphiken, welche Glyphen oder andere graphische Elemente sein können [ISO 15930-4].

Ein Schriftenprogramm (engl.: fontfile) definiert, wie Glyphen dargestellt werden. Ist ein Schriftenprogramm in einer PDF Datei enthalten, so ist die zugehörige Schrift eingebettet (engl.: embedded font).
Enthält die Schrift keinen vollständigen Zeichensatz, sondern z. B. nur die Glyphen der im Dokument verwendeten Zeichen, so redet man von einer Untergruppe (engl.: subsetted font).

Stream Objekt

Besteht aus einem Verzeichnis, gefolgt von keinem oder mehreren Bytes, geklammert zwischen den Schlüsselwörtern 'stream' und 'endstream'.

String Objekt

Besteht aus einer Serie von Bytes (vorzeichenlose Integerwerte im Wertebereich von 0 bis 255). Die Bytes sind keine Integer Objekte, sondern in einer kompakteren Form gespeichert.

Unicode

Internationaler Standard, in dem jedem sinntragenden Schriftzeichen oder Textelement ein eindeutiger Wert zugewiesen wird. Praktisch bedeutungsgleich dazu ist der Universal Character Set [ISO 10646].

Version

Kennzeichnet, anhand welcher PDF Referenz das Dokument erzeugt wurde. Die verarbeitende PDF Software muss diese Version unterstüzten, um eine korrekte Verarbeitung zu gewährleisten. PDF Versionen gehen von 1.0 bis 1.8 (Stand 2009). PDF 1.4 entspricht Acrobat 5, PDF 1.8 entspricht Acrobat 9.

Verzeichnis Objekt (dictionary object)

Eine assoziative Tabelle von Objektpaaren. Das erste Objekte ist der Objektname und fungiert als Schlüssel. Das zweite Objekt ist der Wert und kann eine beliebige Art von Objekt sein, inklusive eines anderen Verzeichnisses.

Web Capture

Bezeichnet den Prozess der Erzeugung von PDF Inhalt durch Importieren und möglicherweise Konvertieren von Dateien aus dem Internet oder lokalen Dateien. Die Dateien können in einem beliebigen Format importiert werden, wie z.B. HTML, GIF, JPEG, Text, und PDF.

XMP Packet

Strukturierter Wrapper für serialisierte XML Metadaten, welche als verschiedene Dateiformate eingebettet werden können.

Zahlenbaum (number tree)

Ähnlich einem Verzeichnis, welches Schlüssel und Werte assoziiert. Die Schlüssel im Zahlenbaum sind Integer und geordnet.

Zeichen (character)

Ein Byte, dessen Wert üblicherweise als Symbol innerhalb eines Symbolsets interpretiert werden, dessen Mitglieder 256 oder weniger zählen. Beispiele für Zeichen sind: 1, 2, a, b, A, &, etc.

Zeilenendemarkierung (EOL marker)

Eine Sequenz von einem oder zwei Zeichen, welches das Ende einer Textzeile markiert, bestehend aus

  • einem CARRIAGE RETURN Zeichen (U+000D)
  • oder einem LINE FEED Zeichen (U+000A)
  • oder einem CARRIAGE RETURN direkt gefolgt von einem LINE FEED.

Zeichensatz (character set)

Ein definierter Satz von Symbolen, in dem jedem Zeichen ein eindeutiger Byte-Wert zugeordnet ist. Beispiele für Zeichensätze sind:

  • ASCII
  • Unicode

PDF/A?

Alles, was Sie über PDF/A wissen müssen...

Top-Whitepapers

PDF/A – der Standard für die Langzeitarchivierung: Was spricht für den PDF/A Standard?...

PDF Grundlagen: Was ist PDF und wie wird es eingesetzt?...

 

PDFA Conference Rome 2010

Copyright 2001-2010 PDF Tools AG

Datenschutz | Rechtliches | Impressum