Kapitel 6. Hauptkomponentenanalyse
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Die Principal component analysis, kurz PCA, ist eines der kleinen Wunder des maschinellen Lernens. Es handelt sich dabei um eine Technik zur Dimensionalitätsreduktion, die die Anzahl der Dimensionen eines Datensatzes reduziert, ohne eine entsprechende Menge an Informationen zu verlieren. Das mag auf den ersten Blick wenig beeindruckend erscheinen, hat aber weitreichende Folgen für Ingenieure und Softwareentwickler, die aus ihren Daten Vorhersagemodelle erstellen wollen.
Was wäre, wenn ich dir sagen würde, dass du einen Datensatz mit 1.000 Spalten mithilfe der PCA auf 100 Spalten reduzieren kannst und dabei 90 % oder mehr der Informationen des ursprünglichen Datensatzes erhalten bleiben? Das kommt relativ häufig vor, ob du es glaubst oder nicht. Und es bietet sich für eine Vielzahl von praktischen Anwendungen an, zum Beispiel:
-
Hochdimensionale Daten auf zwei oder drei Dimensionen reduzieren, damit sie grafisch dargestellt und erforscht werden können
-
Verringerung der Anzahl der Dimensionen in einem Datensatz und anschließende Wiederherstellung der ursprünglichen Anzahl von Dimensionen, was bei der Erkennung von Anomalien und der Rauschfilterung Anwendung findet
-
Anonymisierung von Datensätzen, damit sie mit anderen geteilt werden können, ohne dass die Art oder Bedeutung der Daten preisgegeben wird
Und das ...
Get Angewandtes maschinelles Lernen und KI für Ingenieure now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.