Ungleiche Verteilungen

Bisher sind wir davon ausgegangen, dass Sie eine recht gute Schätzung des Endpreises erhalten, wenn Sie den Durchschnitt oder den gewichteten Durchschnitt der Daten nutzen. Das wird in vielen Fällen korrekt sein, aber in manchen Situationen kann es nicht erfasste Variablen geben, die einen großen Einfluss auf das Ergebnis haben. Stellen Sie sich im Wein-Beispiel vor, dass Käufer in zwei verschiedene Gruppen eingeteilt werden: Personen, die im Weinkontor kaufen, und Personen, die den Wein im Supermarkt gekauft haben und 50% Rabatt bekamen. Leider findet sich diese Information nicht in der Datenmenge.

Die Funktion createhiddendataset erzeugt eine Datenmenge, die diese Eigenschaften simuliert. Sie verwirft ein paar der verkomplizierenden ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.