PEARSON()
495
PEARSON()
PEARSON()
SyntaxPEARSON(Matrix1;Matrix2)
DefinitionDie Funktion PEARSON() gibt den Pearsonschen Korrelationskoeffizienten r zurück. Dieser
Koeffizient ist ein dimensionsloser Index mit dem Wertebereich –1,0 kleiner oder gleich r
kleiner oder gleich 1,0 und ein Maß dafür, inwieweit zwischen zwei Datensätzen eine lineare
Abhängigkeit besteht.
ArgumenteMatrix1 (erforderlich) ist eine Reihe unabhängiger Werte.
Matrix2 (erforderlich) ist eine Reihe abhängiger Werte.
HinweisAls Argumente müssen entweder Zahlen oder Namen, Matrizen oder Bezüge angegeben werden,
die Zahlen enthalten.
Enthält ein als Matrix oder Bezug angegebenes Argument Text, Wahrheitswerte oder leere Zellen,
werden diese Werte ignoriert. Zellen, die den Wert 0 enthalten, werden dagegen berücksichtigt.
Enthalten die Argumente Matrix1 und Matrix2 keine oder unterschiedlich viele Datenpunkte, gibt die
Funktion PEARSON() den Fehlerwert #NV zurück.
Hintergrund
Ein quantitatives Maß für die Stärke des Zusammenhangs bei metrischen Merkmalen bietet
der Korrelationskoeffizient nach Bravais-Pearson (empirischer Korrelationskoeffizient).
Dieser wird in Excel mit der Funktion PEARSON() berechnet. Als Eingabe fungieren zwei auszu-
wählende Datenreihen: Matrix1 und Matrix2. Die erste Datenreihe stellt die Werte der unabhän-
gigen Variable x dar, die zweite Datenreihe besteht aus den Werten der abhängigen Variable y.
Das Ergebnis der Berechnung für r über die Funktion PEARSON() liegt im Wertebereich
zwischen –1 und +1. Doch was sagen die Ergebnisse innerhalb dieses Wertebereiches aus?
씰
Bei r = –1 liegt eine perfekte negative Korrelation vor – das heißt, die Datenreihen sind
nicht voneinander abhängig
씰
Bei r = +1 liegt eine perfekte positive Korrelation vor – das heißt, die Datenreihen sind
absolut voneinander abhängig
씰
Ein Wert in der Nähe von r = 0 bedeutet, das keine lineare Korrelation vorliegt
Der Zusammenhang zwischen den beiden Merkmalen muss linear sein, da ein nichtlinearer
Zusammenhang von der Funktion PEARSON() nicht erfasst wird. Deshalb sollte zusätzlich
zur Berechnung des Korrelationskoeffizienten r immer auch das Streudiagramm betrachtet
werden. Ansonsten könnte man fälschlicherweise behaupten, ein Merkmalspaar zeige auf-
grund des errechneten Werts für r, keinen Zusammenhang auf obwohl ein nichtlinearer, also
beispielsweise ein exponentieller, Zusammenhang vorliegt.
Der Wert eines Korrelationskoeffizienten, errechnet durch die Funktionen PERARSON()
oder KORREL(), gibt keine Richtung der Beeinflussung zwischen zwei Variablen vor. Diese
kann nur durch inhaltliche Überlegungen gefunden werden. Darüber hinaus muss bei der
Interpretation einer statistisch gesicherten Korrelation von Fall zu Fall geklärt werden, ob es
sich um einen echten oder nur um einen scheinbaren Zusammenhang handelt. Dazu ist
jeweils Kenntnis über den Sachverhalt nötig.
Scheinkorrelationen, die inhaltlich nicht gerechtfertigt sind, findet man oft in Zeitreihen,
wenn für die beiden Variablen der gleiche Trend vorherrscht.