Kapitel 49. Vertiefung: Kernel-Dichte-Schätzung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kapitel 48 haben wir uns mit Gauß'schen Mischmodellen beschäftigt, die eine Art Hybrid zwischen einem Clustering-Schätzer und einem Dichte-Schätzer sind. Ein Dichte-Schätzer ist ein Algorithmus, der eine D -dimensionalen Datensatz nimmt und eine Schätzung der D -dimensionalen Wahrscheinlichkeitsverteilung, aus der die Daten stammen. Der GMM-Algorithmus erreicht dies, indem er die Dichte als eine gewichtete Summe von Gaußverteilungen darstellt. Die Kernel-Dichte-Schätzung(KDE) ist in gewisser Weise ein Algorithmus, der die Idee der Gauß'schen Mischung auf die Spitze treibt: Er verwendet eine Mischung, die aus einer Gauß'schen Komponente pro Punkt besteht, was zu einem im Wesentlichen nichtparametrischen Schätzer der Dichte führt. In diesem Kapitel werden wir die Motivation und die Einsatzmöglichkeiten von KDE untersuchen.

Wir beginnen mit den Standardimporten:

In [1]: %matplotlib inline
        import matplotlib.pyplot as plt
        plt.style.use('seaborn-whitegrid')
        import numpy as np

Motivierende Kernel-Dichte-Schätzung: Histogramme

Wie bereits erwähnt, ist ein Dichteschätzer ein Algorithmus, der versucht, die Wahrscheinlichkeitsverteilung zu modellieren, die einen Datensatz erzeugt hat. Für eindimensionale Daten kennst du wahrscheinlich bereits einen einfachen Dichteschätzer: das Histogramm. Ein Histogramm ...

Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.