KAPITEL 6

Dimensionsreduktion: Mit dem Hauptkomponentenverfahren die Datenwolke flach drücken

Mithilfe automatischer Verfahren zur Datensammlung und Merkmalserzeugung kann man im Handumdrehen eine große Zahl von Merkmalen bekommen. Aber nicht alle davon sind sinnvoll. In den Kapiteln 3 und 4 besprachen wir das Filtern nach Häufigkeit und die Merkmalsskalierung als Möglichkeiten, um aussagelose Merkmale zu beseitigen. Nun werfen wir einen genauen Blick auf die Reduktion der Merkmalsdimensionen mithilfe des Hauptkomponentenverfahrens (PCA, engl. Principal Component Analysis).

Dieses Kapitel stellt einen Einstieg in die modellbezogenen Verfahren zur Merkmalskonstruktion dar. Die meisten bisher gezeigten Verfahren funktionieren unabhängig von den ...

Get Merkmalskonstruktion für Machine Learning now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.