13Arbeiten mit PDF- und Word-Dokumenten

image PDF- und Word-Dokumente sind Binärdateien, was den Umgang mit ihnen viel komplizierter macht als die Verwendung von reinen Textdateien. Neben Text enthalten sie auch eine Menge an Informationen über Schriftarten, Farben und das Layout. Wenn Ihre Programme PDF- oder Word-Dokumente lesen oder schreiben können sollen, müssen Sie mehr tun, als einfach nur den Dateinamen an open() zu übergeben.

Zum Glück gibt es Python-Module, die die Arbeit mit PDF- und Word-Dokumenten erleichtern. In diesem Kapitel lernen Sie zwei dieser Module kennen, nämlich PyPDF2 und Python-Docx.

PDF-Dokumente

PDF steht für Portable Document ...

Get Routineaufgaben mit Python automatisieren now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.