PDF Glossar

Begriffserklärungen und Ausdrücke rund um PDF Werkzeuge. 
Kontaktieren Sie uns, wenn Sie einen Begriff vermissen.


A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
#A

Annotation

Assoziiert ein Objekt, wie z. B. eine Notiz, Musik oder Film mit einer Position auf der Seite, oder stellt eine Möglichkeit dar, um mit dem Benutzer mit Hilfe von Maus und Tastatur zu interagieren.

Viele PDF Dokumente sind so konzipiert, dass der Benutzer den Seiteninhalt nicht verändern darf, sondern nur mit Annotationen interagieren kann, z. B. Formularfeldern und Checkboxen.

Antialiasing

Je nach Auflösung einen Bildes entsteht ein Treppeneffekt an den Kanten von Objekten. 

Dieser Effekt kann durch Antialiasing-Methoden gemindert werden. Durch die nachträgliche «Filterung» werden die Kanten mit angepassten Farbwerten geglättet.

Array object

Eine eindimensionale Kollektion von sequenziellen Objekten mit implizierter Nummerierung, beginnend bei 0.

ASCII

Der Amerikanische Standard Code für Informationsaustausch (engl.: American Standard Code for Information Interchange) ist eine weit verbreitete Konvention, um ein spezifisches Set von 128 Zeichen binär zu kodieren. Im ASCII Zeichensatz sind das Leerzeichen sowie folgende Zeichen enthalten:
"#$%& '()*+,-. /0123456 789:;<=> ?@ABCDEF GHIJKLMN OPQRSTUV WXYZ[\]^ _`abcdef ghijklmn opqrstuv wxyz~

#B

Binäre Daten

Eine geordnete Sequenz von Bytes. Beispiele für Objekte, welche binär abgelegt werden, sind Bilder und Schriften.

Boolsches Objekt

Hierbei handelt es sich entweder um das Schlüsselwort 'wahr' (true) oder das Schlüsselwort 'falsch' (false).

Byte

Ein Byte ist eine Gruppe von 8 binären Ziffern (8 Bit), welche zusammen einen von 256 verschiedenen Werten repräsentieren können. Die 8 binären Ziffern werden heute in einer Vielzahl von elektronischen Geräten verwendet.

#D

Direktes Objekt (direct object)

Jedes Objekt, welches nicht zu einem indirekten Objekt gemacht wurde.

#E

Elektronisches Dokument

Ist eine elektronische Repräsentation einer seitenorientierten Sammlung von Text, Bildern, grafischen Daten und Metadaten, welche hilfreich zum Identifizieren, Verstehen und Darstellen der Daten sind und ohne signifikanten Informationsverlust auf Papier reproduziert oder angezeigt werden können.

#F

Filter

Ein optionaler Teil der Spezifikation eines Datenstromobjektes, welches beschreibt, wie die Daten des Datenstroms dekodiert werden sollten, bevor sie genutzt werden. Beispiele für Filter sind: Flate, DCT.

Funktion

Ein spezieller Objekttyp, welcher eine parametrisierte Klasse repräsentiert, inklusive mathematischen Formeln und gesampelten Repräsentationen von beliebiger Auflösung.

#G

Gauss Filter

Filter, welcher in der Bildbearbeitung Bildrauschen durch Glättung oder Weichzeichnen vermindern kann. 

Glyph

Erkennbares abstraktes grafisches Symbol, unabhängig von jeglichem spezifischen Design [ISO/IEC 9541-1]. Beispiele von Glyphen des Zeichens "A" sind: A, A, A

Grafikzustand (graphic state)

Das oberste Element eines Stapelspeichers enthält die Parameter zur Steuerung der grafischen Darstellung. Der Grafikzustand enthält Informationen wie z.B. Farbe, Schrift, Schriftgrösse, aktuelle Transformationsmatrix, etc.

#H

Hint

Hinting ist ein Verfahren, welches die Darstellungsqualität von Schriften verbessert, indem die Umrisse bei der Darstellung von Schriftzeichen optimiert wird.

#I

ICC Profile

Farbprofil konform zur ICC Spezifikation [ISO 15076-1:2005].

Indirektes Objekt

Ein Objekt, welches mit einem positiven Integer Objekt bezeichnet ist, gefolgt von einer nicht-negativen Integer Generationsnummer und obj. Beendet wird es mit endobj.

Inhaltdatenstrom (content stream)

Ein Datenstrom-Objekt, dessen Daten aus einer Sequenz von Instruktionen besteht, welche die zu zeichnenden grafischen Elemente der Seite beschreiben.

Integer object

Mathematischer Integer derart implementiert, dass 0 das Zentrum des Intervals bildet. Die Zahl kann ein- oder mehrstellig sein und optional ein Vorzeichen haben.

Interpolation

Verfahren, welches in der Bildbearbeitung das Zusammenspiel von Pixeldichte und Farbtiefe in Rastergrafiken regelt. Die bilineare Interpolation ist eine Erweiterung für die Skalierung und Darstellung von Texturen bei gerenderten Bildern.

ISO 19005

Siehe PDF/A.

ISO 32000

Siehe PDF.

#K

Katalog (catalog)

Das primäre Verzeichnisobjekt einer PDF Datei, welches die direkten oder indirekten Referenzen zu allen anderen Objekten des Dokumentes enthält, mit Ausnahme von Objekten des Anhangs (engl.: trailer). Diese sind nicht im Katalog referenziert.

Konformes erzeugendes Programm (conforming reader)

Software Applikation, welche eine PDF Datei, die zu einer Spezifikation wie z.B. [ISO 32000] oder [ISO 19005-1] konform ist, lesen und bearbeiten kann und die den Anforderungen eines konformen erzeugenden Programms entspricht.

Konformes Produkt (conforming product)

Software Applikation, welche sowohl ein konformes erzeugendes wie auch ein konformes verarbeitendes Programm ist.

Konformes verarbeitendes Programm (conforming writer)

Software Applikation, welche PDF Dateien erzeugen kann, die konform zu einer Spezifikation sind, wie z.B. [ISO 32000] oder [ISO 19005-1].

Korrupte PDF Datei

Ein PDF Dokument, welches nicht korrekt ist, und dadurch u.U. unlesbar wird. Mögliche Ursachen sind:

  • Das Dokument wurde nicht korrekt erstellt.
  • Das Dokument wurde nachträglich beschädigt (z.B. unvollständiger Kopiervorgang).
#L

Leerzeichen (space character, white-space character)

Textzeichen, welches verwendet wird, um den orthografischen Leerschlag zu repräsentieren. Dazu gehören folgende Zeichen:

  • HORIZONTAL TABULATION (U+0009)
  • LINE FEED (U+000A)
  • VERTICAL TABULATION (U+000B)
  • FORM FEED (U+000C)
  • CARRIAGE RETURN (U+000D)
  • SPACE (U+0020)
  • NOBREAK SPACE (U+00A0)
  • EN SPACE (U+2002)
  • EM SPACE (U+2003)
  • FIGURE SPACE (U+2007)
  • PUNCTUATION SPACE (U+2008)
  • THIN SPACE (U+2009)
  • HAIR SPACE (U+200A)
  • ZERO WIDTH SPACE (U+200B)
  • IDEOGRAPHIC SPACE (U+3000)
#M

Multiple Master Fonts

Variation des Postscript-Type1-Formates, welche die Möglichkeit von beliebigen Darstellungsvariationen einer Schriftart zulassen. Zusätzlich zu den üblichen Ausprägungen können z.B. Strichstärke und Proportionen angepasst werden.

#N

Namen Objekt

Ein atomares Symbol, einzigartig definiert durch eine Zeichensequenz, welche mit einem Querstrich (/, U+002F) beginnt. Der Querstrich ist jedoch nicht Teil des Namens.

Namenbaum (name tree)

Ähnlich einem Verzeichnis, welches Schlüssel und Werte assoziiert. Doch die Schlüssel im Namensbaum sind Strings und geordnet.

null Objekt

Ein einzelnes Objekt vom Typ null, bezeichnet durch das Schlüsselwort null, dessen Typ und Wert verschieden zu allen anderen Objekten ist.

Numerisches Objekt

Entweder ein Integer Objekt oder ein Reelles Objekt.

#O

Objekt

Eine Grunddatenstruktur, anhand derer PDF Dateien konstruiert werden. Ein Objekt kann von folgendem Typ sein: Array, Boolsch, Verzeichnis, Integer, Name, null, Reell, Datenstrom oder String.

Objekt Referenz

Ein Objektwert, der erlaubt, ein Objekt mit einem anderen zu referenzieren. Sie hat die Form "<n> <m> R", wobei <n> eine indirekte Objektnummer ist, <m> dessen Versionsnummer, und R ist der Grossbuchstabe R.

Objektdatenstrom (object stream)

Ein Datenstrom, welcher eine Sequenz von PDF Objekten enthält.

OCR

Texterkennung oder auch Optische Zeichenerkennung (englische Abkürzung OCR von englisch optical character recognition, selten auch: OZE) ist ein Begriff aus der Informationstechnik und bezeichnet die automatisierte Erkennung von Text innerhalb von Bildern.

#P

PDF

Portable Document Format Dateiformat, definiert in [ISO 32000].

PDF/A

Portable Document Format für Archivierung, definiert in [ISO 19005]. Beschreibt die Anforderungen an PDF Dokumente, um den Normen PDF/A-1a und PDF/A-1b zu entsprechen. Die grundsätzlichen Anforderungen an PDF/A-1b sind:

  • Konformität mit PDF Version 1.4
  • Einbettung aller Schriften, welche für sichtbaren Text verwendet werden.
  • Einbettung von Farbprofilen, wenn der verwendete Farbraum dies vorschreibt.
  • Keine Verschlüsselung
  • Keine Transparenz

Bei PDF/A-1a gilt zusätzlich:

  • Kodierung von Text als UNICODE
  • Es muss eine strukturelle Information vorliegen (Tagging).
#Q

Querverweistabelle (cross reference table)

Datenstruktur, welche den Byte-Offset Startpunkt aller indirekten Objekte der Datei enthält.

#R

Rechteck (rectangle)

Ein spezifisches Array-Objekt, welches die Position und die Zeichenboxen (engl.: bounding boxes) einer Seite für verschiedene Objekte beschreibt. Es wird dargestellt als Array von 4 Zahlen, welche die Koordinatenpaare von zwei diagonal gegenüberliegenden Ecken bezeichnen, üblicherweise in der Form [unten links X, Y, oben rechts X, Y].

Reelles Objekt (real object)

Approximiert mathematische reelle Zahlen, doch mit limitiertem Wertebereich und Präzision. Geschrieben wird es als eine oder mehrere Ziffern mit einem optionalen Vorzeichen und einem optionalen Dezimalpunkt.

Ressourcenverzeichnis (resource dictionary)

Assoziiert Ressourcen mit Namen. Es wird in Inhaltsdatenströmen verwendet und enthält die Resourcen Objekte, welche es in verschiedene Kategorien (z.B. Schrift, Farbraum, Pattern) organisiert.

#S

Schrift (font)

Identifizierte Sammlung von Graphiken, welche Glyphen oder andere graphische Elemente sein können [ISO 15930-4].

Ein Schriftenprogramm (engl.: fontfile) definiert, wie Glyphen dargestellt werden. Ist ein Schriftenprogramm in einer PDF Datei enthalten, so ist die zugehörige Schrift eingebettet (engl.: embedded font).

Enthält die Schrift keinen vollständigen Zeichensatz, sondern z. B. nur die Glyphen der im Dokument verwendeten Zeichen, so redet man von einer Untergruppe (engl.: subsetted font).

Stream Objekt

Besteht aus einem Verzeichnis, gefolgt von keinem oder mehreren Bytes, geklammert zwischen den Schlüsselwörtern 'stream' und 'endstream'.

String Objekt

Besteht aus einer Serie von Bytes (vorzeichenlose Integerwerte im Wertebereich von 0 bis 255). Die Bytes sind keine Integer Objekte, sondern in einer kompakteren Form gespeichert.

#U

Unicode

Internationaler Standard, in dem jedem sinntragenden Schriftzeichen oder Textelement ein eindeutiger Wert zugewiesen wird. Praktisch bedeutungsgleich dazu ist der Universal Character Set [ISO 10646].

#V

Version

Kennzeichnet, anhand welcher PDF Referenz das Dokument erzeugt wurde. Die verarbeitende PDF Software muss diese Version unterstützen, um eine korrekte Verarbeitung zu gewährleisten. PDF Versionen gehen von 1.0 bis 1.8 (Stand 2009). PDF 1.4 entspricht Acrobat 5, PDF 1.8 entspricht Acrobat 9.

Verzeichnis Objekt (dictionary object)

Eine assoziative Tabelle von Objektpaaren. Das erste Objekt ist der Objektname und fungiert als Schlüssel. Das zweite Objekt ist der Wert und kann eine beliebige Art von Objekt sein, inklusive eines anderen Verzeichnisses.

#W

Web Capture

Bezeichnet den Prozess der Erzeugung von PDF Inhalt durch Importieren und möglicherweise Konvertieren von Dateien aus dem Internet oder lokalen Dateien. Die Dateien können in einem beliebigen Format importiert werden, wie z.B. HTML, GIF, JPEG, Text und PDF.

#X

XMP packet

Strukturierter Wrapper für serialisierte XML Metadaten, welche als verschiedene Dateiformate eingebettet werden können.

#Z

Zahlenbaum (number tree)

Ähnlich einem Verzeichnis, welches Schlüssel und Werte assoziiert. Die Schlüssel im Zahlenbaum sind Integer und geordnet.

Zeichen (character)

Ein Byte, dessen Wert üblicherweise als Symbol innerhalb eines Symbolsets interpretiert wird, dessen Mitglieder 256 oder weniger zählen. Beispiele für Zeichen sind: 1, 2, a, b, A, &, etc.

Zeichensatz (character set)

Ein definierter Satz von Symbolen, in dem jedem Zeichen ein eindeutiger Byte-Wert zugeordnet ist. Beispiele für Zeichensätze sind:

  • ASCII
  • Unicode

Zeilenendemarkierung (EOL marker)

Eine Sequenz von einem oder zwei Zeichen, welche das Ende einer Textzeile markiert, bestehend aus

  • einem CARRIAGE RETURN Zeichen (U+000D)
  • oder einem LINE FEED Zeichen (U+000A)
  • oder einem CARRIAGE RETURN direkt gefolgt von einem LINE FEED.