13Arbeiten mit PDF- und Word-Dokumenten

image PDF- und Word-Dokumente sind Binärdateien, was den Umgang mit ihnen viel komplizierter macht als die Verwendung von reinen Textdateien. Neben Text enthalten sie auch eine Menge an Informationen über Schriftarten, Farben und das Layout. Wenn Ihre Programme PDF- oder Word-Dokumente lesen oder schreiben können sollen, müssen Sie mehr tun, als einfach nur den Dateinamen an open() zu übergeben.

Zum Glück gibt es Python-Module, die die Arbeit mit PDF- und Word-Dokumenten erleichtern. In diesem Kapitel lernen Sie zwei dieser Module kennen, nämlich PyPDF2 und Python-Docx.

PDF-Dokumente

PDF steht für Portable Document ...

Get Routineaufgaben mit Python automatisieren now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.