Klassifikationsbäume

Im Abschnitt „Regressionsbäume“ habe ich im Zusammenhang mit den Regressionsbäumen das CART-Modell eingeführt. CART-Klassifikationsbäume funktionieren ganz ähnlich, es gibt allerdings drei zentrale Unterschiede. Zum einen ist das die Kriteriumsvariable, bei Regressionsbäumen ist sie kontinuierlich, bei Klassifikationsbäumen kategorial. Beide Fälle brauchen ihren eigenen Modellanpassungsalgorithmus, der für die Konstruktion des Baums und die Überwachung der Kostenkomplexität sorgt. Zweitens unterscheiden sich die Maße zur Modellgüte (»Knotenunreinheit«), für Klassifikationsprobleme wird üblicherweise der Gini-Index gewählt, während die Modellgüte in Regressionsbäumen über den mittleren quadratischen Fehler (MSE) bestimmt wird. ...

Get R in a Nutshell now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.