PDF/UA
Standard für barrierefreie PDFs, genormt in ISO 14289 — verpflichtet Dokumente zu logischer Struktur, Unicode-Mapping und Alternativtexten, damit Screenreader und assistive Technologien sie korrekt wiedergeben.
Auch bekannt als: PDF/UA-1, PDF/UA-2, ISO 14289, Universal Accessibility
Kurzdefinition
PDF/UA (Universal Accessibility) ist der Standard für barrierefreie PDF-Dokumente, normiert in ISO 14289. Er stellt sicher, dass ein PDF für assistive Technologien — allen voran Screenreader — korrekt lesbar und navigierbar ist. PDF/UA definiert nicht nur was im PDF steht, sondern auch wie es strukturiert sein muss, damit blinde und sehbehinderte Nutzer es verstehen.
Aktuelle Versionen:
- PDF/UA-1 (ISO 14289-1, 2014) — basiert auf PDF 1.7, weit verbreitet
- PDF/UA-2 (ISO 14289-2, 2024) — baut auf PDF 2.0 auf, erweiterte Strukturelemente
Die Kernanforderungen
PDF/UA verlangt, dass ein Dokument:
- Tagged PDF ist — alle Inhalte haben semantische Rollen (Heading, Paragraph, List, Table, Figure…)
- Eine logische Lesereihenfolge definiert — unabhängig von der visuellen Anordnung
- Unicode-Mapping für jede Text-Glyphe bietet — damit Screenreader den Text tatsächlich lesen können
- Alternativtexte für Bilder, Grafiken und Formeln enthält
- Sprachkennungen setzt (
/Lang) — für die richtige Aussprache - Keine rein visuellen Informationsträger nutzt (nur Farbe zur Unterscheidung)
- Tabellen mit echten Tabellen-Tags strukturiert, nicht nur durch Ausrichtung
Tagged PDF — das Herzstück
Ein Tagged PDF trägt einen Strukturbaum (structure tree) parallel zum visuellen Inhalt. Jedes Element im Strukturbaum hat einen Rollennamen aus einer festgelegten Liste:
/Document
├─ /H1 "Rechnung 2026-0042"
├─ /P "Sehr geehrte Damen und Herren …"
├─ /Table
│ ├─ /TR (Kopfzeile)
│ │ ├─ /TH "Position"
│ │ ├─ /TH "Menge"
│ │ └─ /TH "Preis"
│ └─ /TR
│ ├─ /TD "Beratung"
│ ├─ /TD "8 h"
│ └─ /TD "960,00 €"
└─ /Figure (alt: "Firmenlogo")
Assistive Technologien lesen den Strukturbaum statt der visuellen Seite — Lesereihenfolge, Überschriftenhierarchie, Tabellen-Bezüge werden eindeutig.
PDF/UA, PDF/A und WCAG
Drei oft verwechselte Standards:
| Zweck | Verpflichtet | |
|---|---|---|
| PDF/A | Langzeit-Archivierung | visuelle Identität, Self-Contained |
| PDF/UA | Barrierefreiheit | Tagged PDF, Unicode, Alt-Texte |
| WCAG | Web-Barrierefreiheit (allg.) | auf PDF projiziert via WCAG-Techniques |
Sie schließen sich nicht aus: ein Dokument kann gleichzeitig PDF/A-2a (oder PDF/A-3a) und PDF/UA-konform sein. Die Konformitätsstufe -a bei PDF/A verlangt bereits Tagged PDF — die Kombi ist nahtlos.
In Deutschland verweist das Behindertengleichstellungsgesetz (BGG) zusammen mit BITV 2.0 auf die EN 301 549, die für öffentlich zugängliche PDFs faktisch PDF/UA-Konformität fordert.
Mit der Dokmatiq-API PDF/UA erzeugen
Wenn die Content-Areas im DocGen-Request semantisch markiert sind, erzeugt die API automatisch ein Tagged PDF — und auf Wunsch ein PDF/UA-1-konformes Dokument:
curl -X POST https://api.dokmatiq.com/v1/docgen/render \
-H "Authorization: Bearer $DOKMATIQ_KEY" \
-H "Content-Type: application/json" \
-d '{
"outputProfile": "PDF/UA-1",
"language": "de-DE",
"stationery": { "firstPage": "…" },
"contentAreas": [
{ "role": "Heading1", "x": 20, "y": 40, "html": "<h1>Rechnung 2026-0042</h1>" },
{ "role": "Paragraph", "x": 20, "y": 60, "html": "<p>Sehr geehrte Damen und Herren …</p>" },
{ "role": "Table", "x": 20, "y": 100, "html": "<table>…</table>" },
{ "role": "Figure", "x": 150, "y": 30, "image": "logo.png", "altText": "Firmenlogo" }
]
}'
Die API mappt die role-Angaben auf die passenden PDF-Strukturtags, setzt /Lang auf de-DE und bettet Unicode-Mappings für alle eingebetteten Schriften ein.
Validierung
Für PDF/UA gibt es drei etablierte Prüfwege:
- PAC 2024 / PAC 3 — kostenloser Validator der Access for All Stiftung
- veraPDF — Open-Source, unterstützt PDF/UA-1 zusätzlich zur PDF/A-Prüfung
- Matterhorn Protocol — Testkatalog mit 31 Fehlerbedingungen und 136 Techniken
Die Dokmatiq-API nutzt intern veraPDF und lehnt Dokumente ab, die das Profil verletzen, bevor sie ausgeliefert werden.
Häufige Stolpersteine
- „Tagged PDF” automatisch aus Word reicht oft nicht — Word erzeugt Tags, aber Tabellen und Formulare landen häufig ohne korrekte Struktur
- Alt-Text fehlt oder ist generisch — „image001.jpg” ist kein Alternativtext; er muss die Bild-Aussage transportieren
- Farbe als einziger Bedeutungsträger — „rote Beträge = überfällig” ohne Symbol oder Text verletzt PDF/UA
- Sprachkennung vergessen — ohne
/Langliest der Screenreader jeden Text in der Default-Sprache vor
Bereit, es direkt per API zu nutzen?
Kostenlos starten. Keine Kreditkarte. 100 Dokumente pro Monat inklusive.