Kapitel 49. Vertiefung: Kernel-Dichte-Schätzung
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In Kapitel 48 haben wir uns mit Gauß'schen Mischmodellen beschäftigt, die eine Art Hybrid zwischen einem Clustering-Schätzer und einem Dichte-Schätzer sind. Ein Dichte-Schätzer ist ein Algorithmus, der eine-dimensionalen Datensatz nimmt und eine Schätzung der-dimensionalen Wahrscheinlichkeitsverteilung, aus der die Daten stammen. Der GMM-Algorithmus erreicht dies, indem er die Dichte als eine gewichtete Summe von Gaußverteilungen darstellt. Die Kernel-Dichte-Schätzung(KDE) ist in gewisser Weise ein Algorithmus, der die Idee der Gauß'schen Mischung auf die Spitze treibt: Er verwendet eine Mischung, die aus einer Gauß'schen Komponente pro Punkt besteht, was zu einem im Wesentlichen nichtparametrischen Schätzer der Dichte führt. In diesem Kapitel werden wir die Motivation und die Einsatzmöglichkeiten von KDE untersuchen.
Wir beginnen mit den Standardimporten:
In
[
1
]:
%
matplotlib
inlineimport
matplotlib.pyplot
as
plt
plt
.
style
.
use
(
'seaborn-whitegrid'
)
import
numpy
as
np
Motivierende Kernel-Dichte-Schätzung: Histogramme
Wie bereits erwähnt, ist ein Dichteschätzer ein Algorithmus, der versucht, die Wahrscheinlichkeitsverteilung zu modellieren, die einen Datensatz erzeugt hat. Für eindimensionale Daten kennst du wahrscheinlich bereits einen einfachen Dichteschätzer: das Histogramm. Ein Histogramm ...
Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.