Rozdział 2. Przygotowywanie danych do analiz

Podawane są różne szacunki czasu poświęcanego przez danologów na przygotowywanie danych, ale można bezpiecznie przyjąć, że ten etap odpowiada za dużą część pracy z danymi. W 2014 roku w „New York Timesie” (https://oreil.ly/HX1cO) napisano, że danologowie spędzają od 50% do 80% czasu na oczyszczaniu i przekształcaniu danych. Z ankiety przeprowadzonej na platformie CrowdFlower w 2016 roku (https://oreil.ly/5h28Y) wynika, że danologowie poświęcają 60% czasu na oczyszczanie i porządkowanie danych, aby przygotować je do analiz lub modelowania. Przygotowywanie danych jest tak często wykonywanym zadaniem, że w języku angielskim powstały specjalne nazwy do jego opisu, na przykład data munging, data wrangling ...

Get Analiza danych z wykorzystaniem SQL-a now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.