Word zu PDF — treue Konvertierung ohne Microsoft Office auf dem Server
Konvertiere .docx-Dateien in PDFs, die dem Original visuell entsprechen. Inklusive eingebetteter Schriften, Kopf-/Fußzeilen, Platzhalter-Ersetzung und PDF/A-Archivformat.
Was es macht
Die API nimmt eine .docx-Datei entgegen und liefert ein PDF mit layouttreuer Konvertierung. Kein MS Word und kein LibreOffice-Daemon im eigenen Betrieb nötig — die Rendering-Engine läuft serverseitig, deterministisch und horizontal skalierbar.
Bonus: vor der Konvertierung können Platzhalter ersetzt werden — so wird ein Vertrags-Template automatisch mit Kundendaten befüllt.
Minimaler Request
curl -X POST https://api.dokmatiq.com/v1/convert/word-to-pdf \
-H "Authorization: Bearer $DOKMATIQ_KEY" \
-F "document=@vertrag-template.docx" \
-o vertrag.pdf
Response: Content-Type: application/pdf, Status 200.
Mit Platzhalter-Ersetzung
Ein .docx mit Platzhaltern in der Form {{kundenname}}, {{datum}}, {{betrag}}:
curl -X POST https://api.dokmatiq.com/v1/convert/word-to-pdf \
-H "Authorization: Bearer $DOKMATIQ_KEY" \
-F "document=@vertrag-template.docx" \
-F 'variables={"kundenname":"Muster AG","datum":"18.04.2026","betrag":"12.500,00 €"}' \
-F "outputProfile=PDF/A-3b" \
-o vertrag-muster-ag.pdf
Die Platzhalter-Syntax funktioniert mit Text, aber auch mit Bildern ({{logo}}), Tabellen (zeilenweise mit {#items}...{/items}) und einfachen Bedingungen ({#isPremium}...{/isPremium}).
Was sauber konvertiert wird
- Schriften (eingebettet oder ersetzt durch Metrik-kompatible)
- Kopf- und Fußzeilen, Seitenzahlen
- Inhaltsverzeichnisse (mit Seitenbezügen, klickbar im PDF)
- Tabellen mit Zellen-Merges, Rahmen, Schattierungen
- Eingebettete Bilder (PNG, JPEG, SVG)
- Hyperlinks
- Fußnoten, Endnoten
- Kommentare (optional ausgeblendet)
- Nachverfolgte Änderungen (optional akzeptiert oder als Annotationen)
Was besondere Aufmerksamkeit braucht
- Exotische OLE-Objekte (eingebettete Excel-Diagramme): werden als statische Bilder konvertiert
- Makros (
.docm): werden ignoriert (Security), Inhalte bleiben erhalten - Geschützte Bereiche mit Passwort: müssen entsperrt sein
- Nicht-Standard-Schriften: werden serverseitig nur aus einem kuratierten Font-Pool geladen; fehlende Fonts werden via Font-Fallback ersetzt
Wofür man es einsetzt
- Verträge aus Word-Templates mit Kundendaten aus CRM
- Angebote, Bestellungen, Rechnungen aus SAP/DATEV-Exports
- Gutachten, Berichte mit langen Lauftexten und Abbildungen
- Behördenbriefe, Bescheide mit juristischen Textbausteinen
- Serienbriefe — ein Template, hunderte Personalisierungen
Vergleich mit Alternativen
| Dokmatiq Word-zu-PDF | Microsoft Office (Server) | LibreOffice Headless | docx2pdf (Python) | |
|---|---|---|---|---|
| Lizenz | enthalten | kommerziell, restriktiv | LGPL | MIT, braucht Office |
| Skalierung | API-seitig | schwierig auf Linux | Daemon verwaltet | lokal, nicht parallel |
| Layouttreue | hoch | höchste | gut, gelegentliche Abweichungen | nur mit Office |
| Platzhalter | eingebaut | über OpenXML-SDK | extern | extern |
| Deterministisch | ja | nein (Auto-Update-Risiko) | meistens | meistens |
| PDF/A | per Flag | eingeschränkt | ja | nein |
Microsoft Office Server-seitig zu betreiben ist lizenzrechtlich heikel und technisch fragil. LibreOffice-Daemon ist eine valide Alternative, wird aber schnell zum Betriebsthema (Crashs, Font-Management, Zombies).
Häufige Stolpersteine
- Inhaltsverzeichnis mit falschen Seitenzahlen — vor dem Upload in Word die Feldaktualisierung laufen lassen, sonst zeigt das PDF die alten Seitenzahlen
- Fehlende Corporate-Schrift — Corporate Fonts über den Font-Upload-Endpunkt registrieren; sonst greift der Fallback
- Track Changes akzeptiert/abgelehnt? — Default ist „akzeptiert”; für Review-Szenarien mit
trackChanges: "visualize"als Annotationen rendern - Encoding-Probleme —
.docxist immer UTF-8; manuell erzeugte OOXML-Dateien verletzen das manchmal und brechen Umlaute
Direkt ausprobieren
100 Konvertierungen pro Monat kostenlos. Keine Kreditkarte. Stateless REST — du sendest, du bekommst.