Kapitel 45. Vertiefung: Hauptkomponentenanalyse

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bisher haben wir uns eingehend mit Schätzern des überwachten Lernens befasst, also mit Schätzern, die auf der Grundlage von gelabelten Trainingsdaten Labels vorhersagen. Hier sehen wir uns nun verschiedene unüberwachte Schätzer an, die interessante Aspekte der Daten hervorheben können, ohne auf bekannte Kennzeichnungen zu verweisen.

In diesem Kapitel werden wir uns mit einem der vielleicht am häufigsten verwendeten unüberwachten Algorithmen beschäftigen, der Hauptkomponentenanalyse (PCA). Die PCA ist in erster Linie ein Algorithmus zur Dimensionalitätsreduzierung, kann aber auch als Werkzeug für die Visualisierung, Rauschfilterung, Merkmalsextraktion und Technik und vieles mehr eingesetzt werden. Nach einer kurzen konzeptionellen Erörterung des PCA-Algorithmus werden wir einige Beispiele für diese weiteren Anwendungen untersuchen.

Wir beginnen mit den Standardimporten:

In [1]: %matplotlib inline
        import numpy as np
        import matplotlib.pyplot as plt
        plt.style.use('seaborn-whitegrid')

Einführung in die Hauptkomponentenanalyse

Die Hauptkomponentenanalyse ist eine schnelle und flexible unüberwachte Methode zur Dimensionalitätsreduktion von Daten, die wir inKapitel 38 kurz kennengelernt haben. Ihr Verhalten lässt sich am einfachsten anhand eines zweidimensionalen Datensatzes veranschaulichen. Betrachte diese ...

Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.