Testen mehrerer Hypothesen
Wie bereits erwähnt, gibt es ein Sprichwort in der Statistik: »Foltere die Daten lange genug, und sie werden gestehen.« Das bedeutet, dass man, wenn man die Daten nur aus ausreichend verschiedenen Perspektiven betrachtet und genügend Fragen stellt, fast ausnahmslos einen statistisch signifikanten Effekt finden wird.
Wenn Sie beispielsweise 20 Prädiktorvariablen und eine Zielvariable haben, die alle zufällig erzeugt wurden, stehen die Chancen ziemlich gut, dass sich mindestens ein Prädiktor (irrtümlicherweise) als statistisch signifikant herausstellt, wenn Sie 20 Signifikanztests mit einem Signifikanzniveau von 5% durchführen. Wie zuvor erläutert, wird dies als Fehler 1. Art bezeichnet. Sie können diese Wahrscheinlichkeit ...
Get Praktische Statistik für Data Scientists, 2nd Edition now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.