Kapitel 3. Daten, die von Maschinen gelesen werden sollen
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Daten können in vielen verschiedenen Formaten und Dateitypen gespeichert werden. Einige Formate speichern Daten so, dass sie leicht von Maschinen verarbeitet werden können, während andere Daten so gespeichert werden, dass sie von Menschen leicht gelesen werden können. Microsoft Word-Dokumente sind ein Beispiel für das letztere, während CSV, JSON und XML Beispiele für das erstere sind. In diesem Kapitel geht es darum, wie man Dateien liest, die leicht von Maschinen verarbeitet werden können, und in Kapitel 4 und 5 werden wir uns mit Dateien beschäftigen, die für den menschlichen Konsum bestimmt sind.
Hinweis
Dateiformate, die Daten so speichern, dass sie von Maschinen leicht verstanden werden können, werden allgemein als maschinenlesbar bezeichnet. Zu den gängigen maschinenlesbaren Formaten gehören die folgenden:
-
Komma-getrennte Werte (CSV)
-
JavaScript Object Notation (JSON)
-
Extensible Markup Language (XML)
In der gesprochenen und geschriebenen Sprache werden diese Datenformate normalerweise mit ihren kürzeren Namen bezeichnet (z. B. CSV). Wir werden diese Akronyme verwenden.
Wenn du nach Daten suchst oder Daten von einer Organisation oder Behörde anforderst, sind die in diesem Kapitel beschriebenen Formate deine beste verfügbare Ressource. Sie lassen sich leichter verwenden und von ...
Get Data Wrangling mit Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.