Rekursive Partitionierung

Einer der beliebtesten Algorithmen zur Anpassung von Baummodellen sind die Klassifikations- und Regressionsbäume (Classification And Regression Trees, kurz CART). CART verwendet für die Anpassung des Baums an die Trainingsdaten einen »gierigen« Algorithmus, der folgendermaßen vorgeht:

  1. Trainingsdaten nach der folgenden Vorschrift teilen und Baum rekursiv aufbauen:

    1. Zu Beginn alle Trainingsdaten als zusammenhängenden Datensatz übernehmen.

    2. Wenn die Anzahl der Beobachtungen die zulässige Untergrenze für eine (weitere) Aufteilung unterschreitet, mit der Teilung des Baums aufhören und den Mittelwert der y-Werte als vorhergesagten Wert des letzten Knotens übernehmen.

    3. Andernfalls die Variable xj und den Wert s suchen, durch die der ...

Get R in a Nutshell now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.