Skip to Content
Praktisches Python Data Wrangling und Datenqualität
book

Praktisches Python Data Wrangling und Datenqualität

by Susan E. McGregor
September 2024
Intermediate to advanced
416 pages
13h 8m
German
O'Reilly Media, Inc.
Book available
Content preview from Praktisches Python Data Wrangling und Datenqualität

Kapitel 9. Einführung in die Datenanalyse

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bisher hat sich dieses Buch vor allem auf die Logistik der Datenbeschaffung, -auswertung, -umwandlung und -erweiterung konzentriert. Wir haben uns damit beschäftigt, wie man Code schreibt, der Daten aus dem Internet abruft, sie aus unfreundlichen Formaten extrahiert, ihre Vollständigkeit bewertet und Inkonsistenzen berücksichtigt. Wir haben sogar darüber nachgedacht, wie wir sicherstellen können, dass die Werkzeuge, die wir für all diese Aufgaben verwenden - unsere Python-Skripte - für unsere Bedürfnisse optimiert sind, sowohl jetzt als auch in Zukunft.

An diesem Punkt ist es jedoch an der Zeit, das Warum dieser Arbeit zu überdenken. In meinem Beitrag "Was ist Datenverarbeitung?" habe ich beschrieben, dass der Zweck der Datenverarbeitung darin besteht, "rohe" Daten in etwas umzuwandeln, das zur Gewinnung von Erkenntnissen und Bedeutung genutzt werden kann. Aber wenn wir nicht zumindest ein gewisses Maß an Analyse durchführen, können wir nicht wissen, ob unsere Datenmanipulation ausreichend war - oder welche Erkenntnisse sie bringen könnte. In diesem Sinne wäre es so, als würdest du deine Datenverarbeitungsarbeit in der Phase der Erweiterung/Umwandlung beenden und dann aus der Küche gehen. Du verbringst nicht Stunden damit, Gemüse vorzubereiten und Zutaten abzumessen, wenn du nicht kochen willst. Und genau ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Python lernen, 5. Auflage

Python lernen, 5. Auflage

Mark Lutz
High Performance Python, 2. Auflage

High Performance Python, 2. Auflage

Micha Gorelick, Ian Ozsvald
Blaupausen für Textanalyse mit Python

Blaupausen für Textanalyse mit Python

Jens Albrecht, Sidharth Ramachandran, Christian Winkler

Publisher Resources

ISBN: 9781098194512Supplemental Content