Kapitel 45. Vertiefung: Hauptkomponentenanalyse
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Bisher haben wir uns eingehend mit Schätzern des überwachten Lernens befasst, also mit Schätzern, die auf der Grundlage von gelabelten Trainingsdaten Labels vorhersagen. Hier sehen wir uns nun verschiedene unüberwachte Schätzer an, die interessante Aspekte der Daten hervorheben können, ohne auf bekannte Kennzeichnungen zu verweisen.
In diesem Kapitel werden wir uns mit einem der vielleicht am häufigsten verwendeten unüberwachten Algorithmen beschäftigen, der Hauptkomponentenanalyse (PCA). Die PCA ist in erster Linie ein Algorithmus zur Dimensionalitätsreduzierung, kann aber auch als Werkzeug für die Visualisierung, Rauschfilterung, Merkmalsextraktion und Technik und vieles mehr eingesetzt werden. Nach einer kurzen konzeptionellen Erörterung des PCA-Algorithmus werden wir einige Beispiele für diese weiteren Anwendungen untersuchen.
Wir beginnen mit den Standardimporten:
In
[
1
]:
%
matplotlib
inlineimport
numpy
as
np
import
matplotlib.pyplot
as
plt
plt
.
style
.
use
(
'seaborn-whitegrid'
)
Einführung in die Hauptkomponentenanalyse
Die Hauptkomponentenanalyse ist eine schnelle und flexible unüberwachte Methode zur Dimensionalitätsreduktion von Daten, die wir inKapitel 38 kurz kennengelernt haben. Ihr Verhalten lässt sich am einfachsten anhand eines zweidimensionalen Datensatzes veranschaulichen. Betrachte diese ...
Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.