Dokmatiq DOKMATIQ

PDF/UA

Standard für barrierefreie PDFs, genormt in ISO 14289 — verpflichtet Dokumente zu logischer Struktur, Unicode-Mapping und Alternativtexten, damit Screenreader und assistive Technologien sie korrekt wiedergeben.

Auch bekannt als: PDF/UA-1, PDF/UA-2, ISO 14289, Universal Accessibility

Kurzdefinition

PDF/UA (Universal Accessibility) ist der Standard für barrierefreie PDF-Dokumente, normiert in ISO 14289. Er stellt sicher, dass ein PDF für assistive Technologien — allen voran Screenreader — korrekt lesbar und navigierbar ist. PDF/UA definiert nicht nur was im PDF steht, sondern auch wie es strukturiert sein muss, damit blinde und sehbehinderte Nutzer es verstehen.

Aktuelle Versionen:

  • PDF/UA-1 (ISO 14289-1, 2014) — basiert auf PDF 1.7, weit verbreitet
  • PDF/UA-2 (ISO 14289-2, 2024) — baut auf PDF 2.0 auf, erweiterte Struktur­elemente

Die Kernanforderungen

PDF/UA verlangt, dass ein Dokument:

  1. Tagged PDF ist — alle Inhalte haben semantische Rollen (Heading, Paragraph, List, Table, Figure…)
  2. Eine logische Lesereihenfolge definiert — unabhängig von der visuellen Anordnung
  3. Unicode-Mapping für jede Text-Glyphe bietet — damit Screenreader den Text tatsächlich lesen können
  4. Alternativtexte für Bilder, Grafiken und Formeln enthält
  5. Sprachkennungen setzt (/Lang) — für die richtige Aussprache
  6. Keine rein visuellen Informations­träger nutzt (nur Farbe zur Unterscheidung)
  7. Tabellen mit echten Tabellen-Tags strukturiert, nicht nur durch Ausrichtung

Tagged PDF — das Herzstück

Ein Tagged PDF trägt einen Strukturbaum (structure tree) parallel zum visuellen Inhalt. Jedes Element im Strukturbaum hat einen Rollennamen aus einer festgelegten Liste:

/Document
 ├─ /H1 "Rechnung 2026-0042"
 ├─ /P "Sehr geehrte Damen und Herren …"
 ├─ /Table
 │   ├─ /TR (Kopfzeile)
 │   │   ├─ /TH "Position"
 │   │   ├─ /TH "Menge"
 │   │   └─ /TH "Preis"
 │   └─ /TR
 │       ├─ /TD "Beratung"
 │       ├─ /TD "8 h"
 │       └─ /TD "960,00 €"
 └─ /Figure (alt: "Firmenlogo")

Assistive Technologien lesen den Strukturbaum statt der visuellen Seite — Lesereihenfolge, Überschriften­hierarchie, Tabellen-Bezüge werden eindeutig.

PDF/UA, PDF/A und WCAG

Drei oft verwechselte Standards:

ZweckVerpflichtet
PDF/ALangzeit-Archivierungvisuelle Identität, Self-Contained
PDF/UABarrierefreiheitTagged PDF, Unicode, Alt-Texte
WCAGWeb-Barrierefreiheit (allg.)auf PDF projiziert via WCAG-Techniques

Sie schließen sich nicht aus: ein Dokument kann gleichzeitig PDF/A-2a (oder PDF/A-3a) und PDF/UA-konform sein. Die Konformitätsstufe -a bei PDF/A verlangt bereits Tagged PDF — die Kombi ist nahtlos.

In Deutschland verweist das Behindertengleichstellungsgesetz (BGG) zusammen mit BITV 2.0 auf die EN 301 549, die für öffentlich zugängliche PDFs faktisch PDF/UA-Konformität fordert.

Mit der Dokmatiq-API PDF/UA erzeugen

Wenn die Content-Areas im DocGen-Request semantisch markiert sind, erzeugt die API automatisch ein Tagged PDF — und auf Wunsch ein PDF/UA-1-konformes Dokument:

curl -X POST https://api.dokmatiq.com/v1/docgen/render \
  -H "Authorization: Bearer $DOKMATIQ_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "outputProfile": "PDF/UA-1",
    "language": "de-DE",
    "stationery": { "firstPage": "…" },
    "contentAreas": [
      { "role": "Heading1", "x": 20, "y": 40, "html": "<h1>Rechnung 2026-0042</h1>" },
      { "role": "Paragraph", "x": 20, "y": 60, "html": "<p>Sehr geehrte Damen und Herren …</p>" },
      { "role": "Table", "x": 20, "y": 100, "html": "<table>…</table>" },
      { "role": "Figure", "x": 150, "y": 30, "image": "logo.png", "altText": "Firmenlogo" }
    ]
  }'

Die API mappt die role-Angaben auf die passenden PDF-Struktur­tags, setzt /Lang auf de-DE und bettet Unicode-Mappings für alle eingebetteten Schriften ein.

Validierung

Für PDF/UA gibt es drei etablierte Prüfwege:

  • PAC 2024 / PAC 3 — kostenloser Validator der Access for All Stiftung
  • veraPDF — Open-Source, unterstützt PDF/UA-1 zusätzlich zur PDF/A-Prüfung
  • Matterhorn Protocol — Testkatalog mit 31 Fehlerbedingungen und 136 Techniken

Die Dokmatiq-API nutzt intern veraPDF und lehnt Dokumente ab, die das Profil verletzen, bevor sie ausgeliefert werden.

Häufige Stolpersteine

  1. „Tagged PDF” automatisch aus Word reicht oft nicht — Word erzeugt Tags, aber Tabellen und Formulare landen häufig ohne korrekte Struktur
  2. Alt-Text fehlt oder ist generisch — „image001.jpg” ist kein Alternativtext; er muss die Bild-Aussage transportieren
  3. Farbe als einziger Bedeutungsträger — „rote Beträge = überfällig” ohne Symbol oder Text verletzt PDF/UA
  4. Sprachkennung vergessen — ohne /Lang liest der Screenreader jeden Text in der Default-Sprache vor

Bereit, es direkt per API zu nutzen?

Kostenlos starten. Keine Kreditkarte. 100 Dokumente pro Monat inklusive.