OAIS (ISO 14721)
Internationales Referenzmodell für digitale Langzeitarchive — definiert Rollen, Informationspakete und Funktionsbereiche, die ein Archiv erfüllen muss, um Inhalte über Jahrzehnte lesbar und verstehbar zu halten.
Auch bekannt als: Open Archival Information System, ISO 14721, Referenzmodell Langzeitarchivierung
Kurzdefinition
OAIS (Open Archival Information System) ist ein Referenzmodell für digitale Langzeitarchive, veröffentlicht vom Consultative Committee for Space Data Systems (CCSDS) und als ISO 14721 normiert. Ursprung: die NASA brauchte ein Modell für die Jahrzehnte-Archivierung von Satellitendaten. Heute ist OAIS der begriffliche Rahmen für jedes Archiv, das Inhalte über technologische Generationswechsel hinweg nutzbar halten will.
OAIS schreibt nicht Technik vor — es definiert Rollen, Pakete und Funktionsbereiche. Die konkrete Umsetzung (PDF/A, WORM-Storage, Signaturen, Zeitstempel) ist offen.
Die drei Informationspakete
OAIS denkt in Informationspaketen (Information Packages, IP) — das Herzstück des Modells:
| Paket | Abkürzung | Rolle |
|---|---|---|
| Submission Information Package | SIP | was der Produzent ans Archiv übergibt |
| Archival Information Package | AIP | was im Archiv aufbewahrt wird |
| Dissemination Information Package | DIP | was ein Nutzer aus dem Archiv erhält |
Ein Archiv validiert und transformiert das SIP in ein AIP (z.B. Konvertierung in PDF/A, Anreicherung um Metadaten, Signatur-Validierung). Auf Anfrage baut es aus AIPs wieder DIPs, die der Nutzer lesen kann.
Die sechs Funktionsbereiche
OAIS teilt das Archiv in sechs Functional Entities:
- Ingest — SIP annehmen, validieren, ins AIP umwandeln
- Archival Storage — AIPs speichern, bitweise Integrität überwachen
- Data Management — Metadaten, Kataloge, Suche
- Preservation Planning — Strategien für Format-Migration, Obsoleszenz-Tracking
- Access — DIPs ausliefern, Zugriffsrechte durchsetzen
- Administration — Richtlinien, Verträge, operative Steuerung
Ein GoBD-konformes Archiv erfüllt diese Funktionen organisatorisch — auch wenn die deutsche Verwaltungsvorschrift das Modell nicht namentlich erwähnt.
Die drei Rollen
OAIS kennt drei externe Akteure:
- Producer — erzeugt die Inhalte, übergibt SIPs
- Consumer — nutzt die Inhalte, bekommt DIPs
- Management — setzt Richtlinien, trägt die Verantwortung
Archive haben oft eine interne Differenzierung (Kuratoren, IT-Betrieb), aber nach OAIS sind alle davon Teil des Archivs.
Designated Community
Ein zentraler OAIS-Begriff: die Designated Community — die Zielgruppe, für die das Archiv seine Inhalte verstehbar halten muss. Bei einer Finanzverwaltung: Betriebsprüfer in 10 Jahren. Bei einer Bibliothek: Forschende und Öffentlichkeit. Die Designated Community bestimmt, welche Representation Information (Formate, Schemata, Wörterbücher) mitarchiviert werden muss, damit der Inhalt nicht zu einem toten Datenmüll wird.
OAIS und PDF/A
PDF/A ist eine der direktesten Antworten auf OAIS-Anforderungen im Dokumentenbereich:
- Visuelle Reproduzierbarkeit — gefordert von OAIS, geliefert durch PDF/A
- Self-Contained — alle Schriften, Farbprofile, Bilder eingebettet → kein externes Wissen nötig
- Offener Standard — ISO 19005, über Jahrzehnte lesbar
- Für PDF/A-3: erlaubt XML-Anhänge, ideal für ZUGFeRD-Archivierung
Dokmatiq erzeugt PDF/A als AIP-tauglichen Output:
curl -X POST https://api.dokmatiq.com/v1/pdf/convert \
-H "Authorization: Bearer $DOKMATIQ_KEY" \
-H "X-Target-Profile: PDF/A-3b" \
--data-binary "@eingang.pdf" | \
curl -X POST https://api.dokmatiq.com/v1/pdf/timestamp \
-H "Authorization: Bearer $DOKMATIQ_KEY" \
--data-binary @- \
-o aip.pdf
Das Ergebnis ist ein PDF/A-3 mit qualifiziertem Zeitstempel — kryptographisch verifizierbar wann es im Archiv landete.
OAIS, GoBD, DIN 31644
OAIS ist Grundlage weiterer Standards:
- DIN 31644 (Kriterien für vertrauenswürdige digitale Langzeitarchive) — deutsche Zertifizierungsgrundlage
- nestor-Siegel — deutsche Zertifikatsvergabe für OAIS-konforme Archive
- Core Trust Seal / ISO 16363 — internationale Audit-Normen
GoBD selbst referenziert OAIS nicht direkt, aber die GoBD-Anforderung „Lesbarkeit während der gesamten Aufbewahrungsfrist” deckt sich faktisch mit dem OAIS-Prinzip der verstehbaren Inhalte für die Designated Community.
Häufige Stolpersteine
- SIP = AIP — viele Archive speichern einfach das Eingangsformat; OAIS verlangt aktive Transformation mit Metadaten-Anreicherung
- Fehlende Preservation Planning — ohne Strategie für Format-Migration veralten Inhalte in 10–15 Jahren
- „Backup” als Archiv missverstanden — Backup schützt vor Datenverlust, Archiv sichert Inhalt und Verständlichkeit
- Designated Community ignoriert — ohne sie weiß das Archiv nicht, welche Kontextinformation es mitarchivieren muss
Bereit, es direkt per API zu nutzen?
Kostenlos starten. Keine Kreditkarte. 100 Dokumente pro Monat inklusive.