Langzeitarchivierung im Öffentlichen Bereich

Was Sie schon immer über PDF/A wissen wollten ...

10.06.2009 | Autor / Redakteur: Olaf Drümmer / Gerald Viola

Quelle: Fyle - Fotolia.com
Quelle: Fyle - Fotolia.com

Seit dem 1. Oktober 2005 ist PDF/A das ISO-standardi-sierte Format für die Langzeitarchivierung von PDF-Dokumenten. Es sorgt nicht nur für die langfristige Lesbarkeit von Dokumenten, sondern ist der Schlüssel für viele Herausforderungen in den Öffentlichen Verwaltungen.

Betrachtet man das digitale Archiv einer Öffentlichen Einrichtung, so findet man in der Regel bei den abgelegten Unterlagen ein Wirrwarr von Formaten vor: Dazu gehören Dokumente, die aus Fachanwendungen in einem eigenen Format generiert wurden, selbst erstellte oder per eMail eingegangene Office-Dateien sowie gescannte Papierdokumente. Diese schwer zu bändigende Formatvielfalt birgt zahlreiche Probleme in sich, die zum Teil bereits jetzt spürbar sind, sich aber insbesondere in einigen Jahren bemerkbar machen werden. Bei der täglichen Arbeit hat beispielsweise der Sachbearbeiter das Problem, dass er mehrere Programme öffnen muss, um einen Vorgang ganzheitlich zu betrachten.

Typisches Beispiel ist eine Bauakte mit Anträgen, gescannten Zeichnungen sowie der gesamten Korrespondenz mit dem Bauträger. Die Arbeitsweise mit mehreren offenen Fenstern ist mühsam und unübersichtlich. Was aber passiert, wenn die Bauakte in zehn Jahren erneut eingesehen werden muss? Eventuell sind dann die Programme, mit denen die internen Dokumente erstellt wurden, gar nicht mehr am Arbeitsplatz verfügbar. Die Reproduzierbarkeit wird somit deutlich erschwert. Das Vorhalten sämtlicher Applikationen über Jahre hinweg ist dabei grundsätzlich mit einem unverhältnismäßigen Aufwand verbunden, ebenso wie eine ständige Migration auf die jeweils neuesten Versionen.

Das Konvertieren in ein herstellerunabhängiges, einheitliches Archivformat ist ein Ansatz, der sofort Abhilfe schaffen kann. Der Markt bietet hierfür unterschiedliche Formate an. In der Vergangenheit waren dies vorzugsweise TIFF oder JPEG und seit dem Jahr 2005 eben auch PDF/A.

Vergleicht man diese drei Formate, so sind erhebliche Unterschiede festzustellen. Das im Vergleich zu der Innovationskraft der IT-Branche alte TIFF-Format resultiert in extrem großen Dateien, insbesondere dann, wenn es sich um farbige Dokumente handelt. JPEG-Dateien haben in der Regel eine schlechte Wiedergabequalität. Metadaten zur Beschreibung und Identifikation der Dokumente werden nicht in einheitlicher Weise unterstützt – ganz zu schweigen von Volltextfähigkeit.

Das PDF/A-Format als normierte Variante des beliebten PDF-Formates speichert Dokumente vergleichsweise kleiner ab, gibt sie originalgetreu wieder, unterstützt Metadaten und ermöglicht die Volltextsuche. Die visuelle Repräsentation der Dokumente bleibt zweifelsfrei erhalten, die Datei enthält stets alle zur Darstellung erforderlichen Bestandteile. Diese erfolgt unabhängig von einem bestimmten Betriebssystem, Produkt oder Hersteller.

Dabei kennt der PDF/A-Standard zwei Ausprägungen: PDF/A-1b adressiert die Integrität der visuellen Darstellung. PDF/A-1a fordert zusätzlich die Auszeichnung der Inhalte eines PDF-Dokuments, sodass dessen logische Struktur („tagged PDF“) erkennbar bleibt, sowie ausreichende Zeichensatzinformationen, damit sämtlicher Text als Unicode interpretiert werden kann – eine wichtige Voraussetzung für das Durchsuchen oder Extrahieren von Text.

PDF allein reicht nicht

Für eine vertrauenswürdige Archivierung von Dokumenten würde das „normale“ PDF-Format mit seinen zahlreichen Versionsständen und seiner immensen Funktionsvielfalt keine verlässliche Grundlage darstellen – es erlaubt einfach zu vieles, das die langfristige Lesbarkeit gefährdet. Aus diesem Grund beinhaltet das PDF/A-Format Restriktionen, die diese Vielfalt auf ein für die Archivierbarkeit sinnvolles Maß reduzieren und dafür sorgen, dass jedes PDF/A-Dokument in sich abgeschlossen und vollständig ist. Eine Selbstdokumentation wird durch die Speicherung von Metadaten auf Grundlage der von Adobe entwickelten eXtensible Metadata Platform (XMP) erreicht.

Lesen Sie auf der nächsten Seite, warum Sie ein Prüf- und Validierungstool einsetzen sollten

 

Überblick

Inhalt des Artikels:

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 2021552 / Standards & Technologie)