KAPITEL 5

Datenaufbereitung

Einführung

»Happy families are all alike; every unhappy family is unhappy in its own way.«

– Leo Tolstoy

»Tidy datasets are all alike, but every messy dataset is messy in its own way.«

– Hadley Wickham

In diesem Kapitel lernen Sie eine konsistente Methode kennen, um Daten in R zu organisieren – eine Organisation, die man als aufbereitete Daten (Tidy Data) bezeichnet. Um Ihre Daten in dieses Format zu bekommen, müssen Sie vorab etwas Arbeit investieren, die sich jedoch auf lange Sicht auszahlt. Nachdem Sie über bereinigte Daten und Tools zum Bereinigen verfügen, die die Pakete im Tidyverse bereitstellen, müssen Sie viel weniger Zeit investieren, um Daten von einer Darstellung in eine andere zu überführen. Folglich haben ...

Get R für Data Science, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.