Rozdział 2. Rozkłady danych i prób
Pokutuje przekonanie, że wraz z nastaniem ery big data przestała istnieć potrzeba tworzenia prób. W rzeczywistości mnożenie się danych różnej jakości i istotności wzmacnia potrzebę tworzenia prób jako narzędzi do efektywnej pracy z różnorodnymi danymi i minimalizowania tendencyjności. Próbkowanie jest także wykorzystywane w różnego rodzaju testach (np. porównywanie wpływu konstrukcji stron internetowych na liczbę odwiedzin).
Rysunek 2.1 przedstawia schemat obrazujący podstawowe pojęcia opisywane w tym rozdziale: rozkłady danych i prób. Lewa strona reprezentuje populację. W statystyce przyjmuje się, że stanowi ona bazowy, ale nieznany rozkład. Jedyna dostępna informacja to próba (ang. sample) danych i jej rozkład ...
Get Statystyka praktyczna w data science now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.