February 2008
Intermediate to advanced
400 pages
10h
German
Dieses Kapitel verwendet einen Algorithmus namens CART (Classification and Regression Trees). Um den Entscheidungsbaum aufzubauen, erstellt der Algorithmus zunächst einen Wurzelknoten. Nachdem er alle Beobachtungen in der Tabelle begutachtet hat, wählt er die beste Variable zum Aufteilen der Daten aus. Dazu schaut er sich die verschiedenen Variablen an und entscheidet, welche Bedingung (zum Beispiel: »Hat der Benutzer die FAQ gelesen?«) die Ergebnisse (für welchen ervice sich der Benutzer entschieden hat) so unterteilt, dass man leichter abschätzenkann, was der Benutzer tun wird.
divideset ist eine Funktion, die die Zeilen in Abhängigkeit von den Daten einer bestimmten Spalte in zwei Sets aufteilt. Diese Funktion erhält eine ...