KAPITEL 8

Merkmalsauswahl

Mittels der Merkmalsauswahl bestimmen wir, welche Merkmale für das Modell von Nutzen sind. Irrelevante Merkmale können sich auf das Modell negativ auswirken, und korrelierte Merkmale können Regressionskoeffizienten (oder die Gewichtung von Merkmalen bei Baummodellen) instabil oder schwer interpretierbar machen.

Zudem müssen Sie den Fluch der Dimensionalität bedenken: Wenn Sie Ihren Daten mehr Dimensionen hinzufügen, werden sie immer dünner verteilt. Dadurch kann es schwierig werden, ein Signal zu erkennen, ohne weitere Daten hinzuzunehmen. Nachbarschaftsbeziehungen verlieren ihre Aussagekraft, wenn mehr Dimensionen dazukommen.

Des Weiteren ist die Trainingszeit normalerweise von der Anzahl von Spalten abhängig (und manchmal ...

Get Machine Learning – Die Referenz now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.