Rekursive Partitionierung
Einer der beliebtesten Algorithmen zur Anpassung von Baummodellen sind die Klassifikations- und Regressionsbäume (Classification And Regression Trees, kurz CART). CART verwendet für die Anpassung des Baums an die Trainingsdaten einen »gierigen« Algorithmus, der folgendermaßen vorgeht:
Trainingsdaten nach der folgenden Vorschrift teilen und Baum rekursiv aufbauen:
Zu Beginn alle Trainingsdaten als zusammenhängenden Datensatz übernehmen.
Wenn die Anzahl der Beobachtungen die zulässige Untergrenze für eine (weitere) Aufteilung unterschreitet, mit der Teilung des Baums aufhören und den Mittelwert der y-Werte als vorhergesagten Wert des letzten Knotens übernehmen.
Andernfalls die Variable xj und den Wert s suchen, durch die der ...
Get R in a Nutshell now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.