KAPITEL 2

Daten- und Stichprobenverteilungen

Ein weitverbreiteter Irrglaube besagt, dass die Ära der großen Datenmengen gleichzeitig zur Folge hat, dass keine Stichproben mehr gezogen werden müssen. Tatsächlich verstärkt die Verbreitung von Daten unterschiedlicher Qualität und Relevanz die Notwendigkeit der Stichprobenziehung als Instrument, um effizient mit einer Vielzahl von Daten zu arbeiten und Verzerrungen zu minimieren. Sogar in einem Projekt mit großen Datenmengen (»Big Data«) werden typischerweise prädiktive Modelle entwickelt und mithilfe von Stichproben getestet. Stichproben werden auch im Rahmen von verschiedenen Arten von Tests verwendet (z.B. beim Vergleich der Wirkung von verschiedenen Webseitendesigns auf die Anzahl von Klicks). ...

Get Praktische Statistik für Data Scientists, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.