KAPITEL 8

Merkmalsauswahl

Mittels der Merkmalsauswahl bestimmen wir, welche Merkmale für das Modell von Nutzen sind. Irrelevante Merkmale können sich auf das Modell negativ auswirken, und korrelierte Merkmale können Regressionskoeffizienten (oder die Gewichtung von Merkmalen bei Baummodellen) instabil oder schwer interpretierbar machen.

Zudem müssen Sie den Fluch der Dimensionalität bedenken: Wenn Sie Ihren Daten mehr Dimensionen hinzufügen, werden sie immer dünner verteilt. Dadurch kann es schwierig werden, ein Signal zu erkennen, ohne weitere Daten hinzuzunehmen. Nachbarschaftsbeziehungen verlieren ihre Aussagekraft, wenn mehr Dimensionen dazukommen.

Des Weiteren ist die Trainingszeit normalerweise von der Anzahl von Spalten abhängig (und manchmal ...

Get Machine Learning – Die Referenz now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.