Kapitel 9. Einführung in die Datenanalyse
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Bisher hat sich dieses Buch vor allem auf die Logistik der Datenbeschaffung, -auswertung, -umwandlung und -erweiterung konzentriert. Wir haben uns damit beschäftigt, wie man Code schreibt, der Daten aus dem Internet abruft, sie aus unfreundlichen Formaten extrahiert, ihre Vollständigkeit bewertet und Inkonsistenzen berücksichtigt. Wir haben sogar darüber nachgedacht, wie wir sicherstellen können, dass die Werkzeuge, die wir für all diese Aufgaben verwenden - unsere Python-Skripte - für unsere Bedürfnisse optimiert sind, sowohl jetzt als auch in Zukunft.
An diesem Punkt ist es jedoch an der Zeit, das Warum dieser Arbeit zu überdenken. In meinem Beitrag "Was ist Datenverarbeitung?" habe ich beschrieben, dass der Zweck der Datenverarbeitung darin besteht, "rohe" Daten in etwas umzuwandeln, das zur Gewinnung von Erkenntnissen und Bedeutung genutzt werden kann. Aber wenn wir nicht zumindest ein gewisses Maß an Analyse durchführen, können wir nicht wissen, ob unsere Datenmanipulation ausreichend war - oder welche Erkenntnisse sie bringen könnte. In diesem Sinne wäre es so, als würdest du deine Datenverarbeitungsarbeit in der Phase der Erweiterung/Umwandlung beenden und dann aus der Küche gehen. Du verbringst nicht Stunden damit, Gemüse vorzubereiten und Zutaten abzumessen, wenn du nicht kochen willst. Und genau ...
Get Praktisches Python Data Wrangling und Datenqualität now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.