Klassifikationsbäume

Im Abschnitt „Regressionsbäume“ habe ich im Zusammenhang mit den Regressionsbäumen das CART-Modell eingeführt. CART-Klassifikationsbäume funktionieren ganz ähnlich, es gibt allerdings drei zentrale Unterschiede. Zum einen ist das die Kriteriumsvariable, bei Regressionsbäumen ist sie kontinuierlich, bei Klassifikationsbäumen kategorial. Beide Fälle brauchen ihren eigenen Modellanpassungsalgorithmus, der für die Konstruktion des Baums und die Überwachung der Kostenkomplexität sorgt. Zweitens unterscheiden sich die Maße zur Modellgüte (»Knotenunreinheit«), für Klassifikationsprobleme wird üblicherweise der Gini-Index gewählt, während die Modellgüte in Regressionsbäumen über den mittleren quadratischen Fehler (MSE) bestimmt wird. ...

Get R in a Nutshell now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.