Distanzmaße
Um Clusteranalysetechniken effektiv einsetzen zu können, müssen zu Beginn die
Abstände zwischen den Beobachtungen gemessen werden. Das lässt sich in R bequem mit der
Funktion dist()
aus dem stats
-Paket erledigen:
dist(x, method = "euclidean", diag = FALSE, upper = FALSE, p = 2)
Die dist()
-Funktion berechnet die Distanz
zwischen allen Beobachtungspaaren eines Objekts, das beispielsweise eine Matrix oder ein
Datenrahmen sein kann. Für die Berechnung kann zwischen verschiedenen Algorithmen
gewählt werden, zurückgegeben wird eine Distanzmatrix (präziser, ein Objekt der Klasse
dist
) mit den berechneten Abständen. Es folgt eine
Beschreibung der dist()
-Argumente:
Argument | Beschreibung | Standardwert |
| Objekt, über dessen Zeilen paarweise Distanzen ... |
Get R in a Nutshell now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.