PEARSON()
495
PEARSON()
PEARSON()
SyntaxPEARSON(Matrix1;Matrix2)
DefinitionDie Funktion PEARSON() gibt den Pearsonschen Korrelationskoeffizienten r zurück. Dieser
Koeffizient ist ein dimensionsloser Index mit dem Wertebereich –1,0 kleiner oder gleich r
kleiner oder gleich 1,0 und ein Maß dafür, inwieweit zwischen zwei Datensätzen eine lineare
Abhängigkeit besteht.
ArgumenteMatrix1 (erforderlich) ist eine Reihe unabhängiger Werte.
Matrix2 (erforderlich) ist eine Reihe abhängiger Werte.
HinweisAls Argumente müssen entweder Zahlen oder Namen, Matrizen oder Bezüge angegeben werden,
die Zahlen enthalten.
Enthält ein als Matrix oder Bezug angegebenes Argument Text, Wahrheitswerte oder leere Zellen,
werden diese Werte ignoriert. Zellen, die den Wert 0 enthalten, werden dagegen berücksichtigt.
Enthalten die Argumente Matrix1 und Matrix2 keine oder unterschiedlich viele Datenpunkte, gibt die
Funktion PEARSON() den Fehlerwert #NV zurück.
Hintergrund
Ein quantitatives Maß für die Stärke des Zusammenhangs bei metrischen Merkmalen bietet
der Korrelationskoeffizient nach Bravais-Pearson (empirischer Korrelationskoeffizient).
Dieser wird in Excel mit der Funktion PEARSON() berechnet. Als Eingabe fungieren zwei auszu-
wählende Datenreihen: Matrix1 und Matrix2. Die erste Datenreihe stellt die Werte der unabhän-
gigen Variable x dar, die zweite Datenreihe besteht aus den Werten der abhängigen Variable y.
Das Ergebnis der Berechnung für r über die Funktion PEARSON() liegt im Wertebereich
zwischen –1 und +1. Doch was sagen die Ergebnisse innerhalb dieses Wertebereiches aus?
Bei r = –1 liegt eine perfekte negative Korrelation vor – das heißt, die Datenreihen sind
nicht voneinander abhängig
Bei r = +1 liegt eine perfekte positive Korrelation vor – das heißt, die Datenreihen sind
absolut voneinander abhängig
Ein Wert in der Nähe von r = 0 bedeutet, das keine lineare Korrelation vorliegt
Der Zusammenhang zwischen den beiden Merkmalen muss linear sein, da ein nichtlinearer
Zusammenhang von der Funktion PEARSON() nicht erfasst wird. Deshalb sollte zusätzlich
zur Berechnung des Korrelationskoeffizienten r immer auch das Streudiagramm betrachtet
werden. Ansonsten könnte man fälschlicherweise behaupten, ein Merkmalspaar zeige auf-
grund des errechneten Werts für r, keinen Zusammenhang auf obwohl ein nichtlinearer, also
beispielsweise ein exponentieller, Zusammenhang vorliegt.
Der Wert eines Korrelationskoeffizienten, errechnet durch die Funktionen PERARSON()
oder KORREL(), gibt keine Richtung der Beeinflussung zwischen zwei Variablen vor. Diese
kann nur durch inhaltliche Überlegungen gefunden werden. Darüber hinaus muss bei der
Interpretation einer statistisch gesicherten Korrelation von Fall zu Fall geklärt werden, ob es
sich um einen echten oder nur um einen scheinbaren Zusammenhang handelt. Dazu ist
jeweils Kenntnis über den Sachverhalt nötig.
Scheinkorrelationen, die inhaltlich nicht gerechtfertigt sind, findet man oft in Zeitreihen,
wenn für die beiden Variablen der gleiche Trend vorherrscht.
Kapitel 11 Statistische Funktionen
496
Generell gilt: Man sollte eine hohe Korrelation nur als Hinweis auf einen bestehenden
Zusammenhang ansehen. Auf kausale Zusammenhänge sollte aufgrund inhaltlicher Über-
legungen geschlossen werden.
Die Formel für den Pearsonschen Korrelationskoeffizienten r lautet:
Dabei sind x und y die Stichprobenmittelwerte MITTELWERT(Matrix1) und MITTEL-
WERT(Matrix2).
Hinweis Der Unterschied zwischen den Funktionen KORREL() und PEARSON() besteht darin, dass bei der
Funktion PEARSON() ein linearabhängiger Zusammenhang zwischen zwei Komponenten vorausge-
setzt wird. Als Argumente für die Funktion werden daher Matrix1, eine Reihe unabhängiger Werte,
und Matrix2, eine Reihe abhängiger Werte, gefordert. Das heißt, über PEARSON() wird die Stärke
einer bereits ersichtlichen Abhängigkeit berechnet, deren Ausmaß jedoch zunächst unbekannt ist.
Bei der Funktion KORREL() wird dieser lineare Zusammenhang nicht vorausgesetzt. Die Werte, für die
eine Korrelation aufgezeigt werden soll, werden wie zwei unabhängige Variablen betrachtet. Deshalb
fordert die Funktion die Argumente Matrix1, ein Zellbereich mit Werten, und Matrix2, ebenfalls ein
Zellbereich mit Werten. Das heißt, über KORREL() wird ein wahrscheinlicher Zusammenhang berech-
net, der jedoch nicht zwingend sein muss.
Praxiseinsatz
Ein in der Softwarebranche tätiges Unternehmen verkauft auf der firmeneigenen Website alle
vom Unternehmen angebotenen Produkte. Regelmäßig verschickt das Unternehmen News-
letter, um über Neuheiten zu informieren und bereits vorhandene, aber auch potenzielle
Neukunden auf die Website und damit auf das Unternehmen aufmerksam zu machen.
Die Produktbestellungen auf der Website sind im vergangenen Jahr merklich gestiegen. Die
Geschäftsführung möchte die Gründe hierfür erforschen. Hängt der Anstieg der Bestellun-
gen mit dem aktiven Marketing und den straffen Werbemaßnahmen der letzten Zeit zusam-
men? Sind durch die vermehrten Websitezugriffe auch die Bestellungen gestiegen?
Abbildung 11.98: Das Streudiagramm zeigt bereits eine lineare Abhängigkeit zwischen den Variablen auf
()()
()()
22
xxyy
r
x
xyy
−−
=
−−
∑∑

Get Microsoft Excel: Formeln & Funktionen - Das Maxibuch, 2., aktualisierte und erweiterte Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.