KAPITEL 5

Explorative Datenanalyse

Einführung

Dieses Kapitel zeigt, wie Sie Visualisierung und Transformation einsetzen, um die Daten systematisch zu erkunden. Statistiker bezeichnen diese Aufgabe als explorative Datenanalyse, kurz EDA.

EDA ist ein iterativer Zyklus, in dem Sie

  1. Fragen über Ihre Daten erzeugen,
  2. nach Antworten suchen, indem Sie die Daten visualisieren, transformieren und modellieren,
  3. die Erkenntnisse nutzen, um die Fragen zu verfeinern und/oder neue Fragen zu generieren.

EDA ist kein formaler Prozess mit einem strengen Satz von Regeln. Vor allen Dingen kommt es hier mehr auf ein gutes Bauchgefühl an. In den Anfangsphasen von EDA sollten Sie jede Idee, die Ihnen in den Sinn kommt, ohne Einschränkungen untersuchen. Manche dieser ...

Get R für Data Science now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.