Nachdem Sie in den vorangegangenen Seiten die Grundlagen über die Wahl von Farbtiefe, Auflösung und komprimierungsmethoden erfahren haben, ist es an der Zeit alles auf eine Frage zu reduzieren: TIFF oder PDF?
Tagged Interchange File Format (TIFF) ist ein Container für eine ganze Reihe von Formaten. Im TIFF können Bitmaps auf verschiedene Weise komprimiert oder sogar unkomprimiert abgelegt werden. Die unterstützten Komprimierungen arbeiten teilweise sehr effektiv und der Container erlaubt das Speichern mehrere logischer Seiten in einer Datei. Ursprünglich wurde das Format von Aldus (von Adobe übernommen) und Microsoft als Datenformat für die Verarbeitung von gescannten Rastergrafiken entwickelt.
Die TIFF-Spezifikation (TIFF 6.0 vom Juni 1992) ist so umfangreich, daß kein Viewer oder bildverarbeitendes Programm in der Lage ist alle möglichen Formate und Unterformate abzudecken. Die TIFF Spezifikation sieht daher eine Baseline-TIFF genannte Teilmenge vor, die alle TIFF-verarbeitenden Programme beherrschen sollen.
Das TIFF-Format ist auch heute noch eines der wichtigsten Formate beim Austausch und der Verarbeitung von digitalen Bilddaten. Neben den klassischen Anwendungen der Druckvorstufe, den Faxanwendungen und der Archivierung findet TIFF sogar bei digitalen Kameras (vor dem Einsatz von RAW-Formaten) Verwendung.
Leider beschränkt sich der TIFF-Container auf wenige Metadaten, so daß z.B. keine zusätzlichen Texte für die Volltext-Indizierung im Container hinterlegt werden können. Bei TIFF-Inhalten handelt es sich immer um Bitmaps bzw. reine Grafikdaten. Die Qualität von Anzeige und Ausdrucken und die Geschwindigkeit hängt bei TIFF-Dateien sehr stark von der Leistung des Viewers oder des bildverarbeitenden Programms ab. Die maximale Dateigröße von TIFF-Dateien beträgt 4 GByte, die Seitenfolge kann bei Multipage-TIFF logisch anders als physisch gespeichert werden. Der Viewer muß in der Lage sein die komplette TIFF-Datei zu puffern oder wahlfrei zugreifen (z.B. auf eine Festplatte), was für Internet-Anwendungen völlig ungeeignet ist.
Das PDF-Format wurde von Adobe Systems entwickelt und 1993 mit dem Programm Acrobat auf den Markt gebracht. Im Kern verwendet Adobe die ebenfalls von Adobe definierten Standards für Postscript und ergänzte den Datenstrom mit einem Container und weiteren Funktionen. Kurzgefaßt: PDF ist Postscript auf Reisen.
PDF-Dateien können verschiedene Inhalte haben: Wird ein PDF direkt per Druckertreiber aus einer Textverarbeitung erstellt, enthält die PDF-Datei keine Grafiken sondern den ursprünglichen Text mit Formatierungsanweisungen. Wenn eine Seite eingescannt wird, so wird eine komprimierte Bitmap im Datenstrom abgelegt, die aber keinen Text zu enthalten braucht. Es sind dann nur Bilddaten im Container vorhanden. Bitmaps und Text-Seiten können sich beliebig im Container abwechseln, mittels OCR kann selbst die Bitmap in der PDF-Datei mit Text unterlegt werden. Eine Vielzahl von PDF-Dateien kann daher mit einem Volltextindex indiziert und durchsucht werden.
Adobe PDF beschreibt die Ausgabeseite, ausgehend von einem für jede Seite festgelegten Format. Im Datenstrom können sich Portrait und Landscape-Orientierung von Seiten und auch Seitengrößen wie DIN A4, DIN A5 oder amerikanische Letter-Formate beliebig abwechseln. Soweit dies nicht beim Druck anders eingestellt wird, werden exact die Seitenformate an Bildschirm und Drucker ausgegeben, die beim erstellen der PDF-Datei verwendet wurden. Unbewußte Verzerrungen der Ausgabe finden nicht statt.
Durch die Linearisierung ( Seiten werden in der Reihenfolge der Seitenzahlen gespeichert) ist es möglich große PDF-Dateien zu "Streamen": Im Viewer können bereits die ersten Seiten angezeigt werden, wenn die restliche Datei noch vom Webserver geladen wird. PDF-Dateien können zudem in verschiedenen Qualitätsstufen erstellt werden, so daß bei der Weitergabe von Daten für die Druckvorstufe die höchstmögliche Qualität, im Internet dagegen möglichst kleine und schnelle PDF-Dateien vom selben Inhalt erstellt werden können.
Adobe PDF ist mittlerweile ein weltweiter Standard und moderne Betriebssysteme (nicht Windows) können PDF-Dateien auch ohne Adobe Acrobat anzeigen. Zum Erstellen von PDF-Dateien ist mittlerweile kein Adobe Acrobat mehr erforderlich: Es gibt freie Bibliotheken (Ghostscript, Open Source) und kommerzielle Programmierschnittstellen für den Ausdruck von Daten in PDF-Dateien. Mit Adobe Acrobat können PDF-Dateien auch nachträglich bearbeitet oder ergänzt werden. Das immer wieder weiterentwickelte PDF-Format erlaubt digitale Signaturen, Verschlüsselung und Passwortschutz. Eine digital signierte PDF-Datei ist in Deutschland als elektronische Form der Rechnung steuerlich anerkannt.
Warum kein Portable Network Graphics (PNG) im Dokumentenmanagement oder in der Archivierung? PNG ist nicht weit genug verbreitet und unterstützt die wichtigen CTTI-Fax-Komprimierungsmethoden für 1Bit Farbtiefe nicht. Der wichtigste Nachteil in Bezug auf die Archivierung und das Dokumentenmanagement ist die Tatsache, daß PNG nur ein Bild pro Datei erlaubt. Multipagedateien oder Dateien mit mehreren Hundert Seiten, wie sie z.B. TIFF und PDF erlauben, sind mit PNG nicht möglich.
TIFF ist ein altes Format mit dem aktuellsten Standard aus 1992: Sehr viele bestehende Archivsysteme bauen auf diesem Dateiformat auf. PDF ist jünger und wird von Adobe immer noch weiter entwickelt, Adobe gewährleistet daß auch ältere PDF-Formate im aktuellen Viewer angezeigt werden können.
Anders als im TIFF-Container werden beim Adobe PDF nicht Bitmaps oder Bilder transportiert sondern Ausgabeseiten beschrieben. Solange alle Seiten in einem Multipage-TIFF in der selben Auflösungen und im selben Ausschnitt (z.B.300 dpi, A4) gescannt wurden, ist der Unterschied kaum zu sehen. Wenn jedoch mit 200dpi gescannte DIM A4 Seiten mit 600 dpi gescannten Din A4 Seiten kombiniert werden, ist nur die PDF-Datei ohne Probleme in der Lage die Darstellung im Viewer jeweils korrekt auf die Seitengröße anzupassen. Kurz gefaßt: Im Adobe PDF wird die Ausgabe beschrieben, im TIFF ist nur die digitalisierte Eingabe gespeichert.
Nach aktuellem Stand (2006) kann das TIFF-Format bei bewährten Systemen immer noch eingesetzt werden. Neue Anforderungen wie z.B. die digitale Signatur bei Rechnungen und das bessere Handling von Ausgabeformaten bei unterschiedlichen Quellformaten lassen sich jedoch nur mit PDF-Dateien realisieren.