Kapitel 11 Statistische Funktionen
400
Hinweis Enthalten BeobachteteWerte und ErwarteteWerte nicht dieselbe Anzahl von Datenpunkten, gibt
CHIQU.TEST() den Fehlerwert #NV zurück.
Der c
2
-Test berechnet zunächst eine c
2
-Statistik, wozu er folgende Formel verwendet:
wobei:
A
ij
= tatsächliche Häufigkeit in der i-ten Zeile, j-ten Spalte
E
ij
= erwartete Häufigkeit in der i-ten Zeile, j-ten Spalte
Z = Zeilenanzahl
S = Spaltenanzahl
Ein niedriger Wert von c
2
ist ein Kennzeichen für Unabhängigkeit. Wie anhand der Formel zu sehen
ist, ist c
2
immer positiv oder gleich 0, aber 0 nur dann, wenn A
ij
= E
ij
für jedes i,j.
CHIQU.TEST() gibt die Wahrscheinlichkeit zurück, dass ein Wert der c
2
-Verteilung mit mindestens
dem Wert, der das Ergebnis der obigen Formal war, zufällig passiert sein könnte, wenn Unabhängig-
keit angenommen wird.
Für das Berechnen dieser Wahrscheinlichkeit verwendet die Funktion CHIQU.TEST() die c
2
-Verteilung
mit einer geeigneten Anzahl von Freiheitsgraden (df).
씰
Bei r größer 1 und c größer 1 ist df = (r – 1)(c – 1)
씰
Bei r gleich 1 und c größer 1 ist df = c – 1
씰
Bei r größer 1 und c gleich 1 ist df = r – 1
r = c = 1 ist nicht zulässig, sodass in diesem Fall der Fehlerwert #NV zurückgegeben wird.
Damit CHIQU.TEST() brauchbar verwendet werden kann, sollte die Zahl der E
ij
nicht zu klein sein.
Einige Statistiker schlagen vor, dass jedes E
ij
größer oder gleich 5 sein sollte.
Hintergrund
Für die Analyse statistischer Zusammenhänge werden sogenannte Tests durchgeführt. Für
den untersuchten Sachverhalt wird eine Nullhypothese formuliert. Diese Nullhypothese gibt
an, welche Ergebnisse erwartet werden, wenn der statistische Zusammenhang exakt einen
bestimmten Wert erreicht. Die Gegenhypothese, auch Alternativhypothese, ist häufig weni-
ger scharf abgegrenzt und zeigt die Spannweite für die untersuchten Methoden.
So nimmt beispielsweise bei der Ziehung der Lottozahlen die Nullhypothese an, dass kein
Unterschied in der Wahrscheinlichkeit der Ziehung einer Kugel besteht, d.h. keine Zahl öfter
gezogen wird als eine andere.
Die Gegenhypothese vermutet dies aber. Dabei wird ein sogenanntes Signifikanzniveau (a)
zugrunde gelegt, das ein Maß für den erlaubten prozentualen Anteil an Fehlern darstellt, um
eine Stichprobe noch als zufällig zu bezeichnen, d.h. die Nullhypothese zu bestätigen.
Beträgt das Signifikanzniveau beispielsweise a = 0,03, kann in drei von hundert Ziehungen
eine Zahl öfter vorkommen als eine andere, um zu behaupten, dass trotzdem eine gleiche
Chance für alle Kugeln besteht, d.h. die Nullhypothese angenommen wird. Beträgt der Fehler
bis zu 3 %, ist das Ergebnis »signifikant«.
2