Ungleiche Verteilungen

Bisher sind wir davon ausgegangen, dass Sie eine recht gute Schätzung des Endpreises erhalten, wenn Sie den Durchschnitt oder den gewichteten Durchschnitt der Daten nutzen. Das wird in vielen Fällen korrekt sein, aber in manchen Situationen kann es nicht erfasste Variablen geben, die einen großen Einfluss auf das Ergebnis haben. Stellen Sie sich im Wein-Beispiel vor, dass Käufer in zwei verschiedene Gruppen eingeteilt werden: Personen, die im Weinkontor kaufen, und Personen, die den Wein im Supermarkt gekauft haben und 50% Rabatt bekamen. Leider findet sich diese Information nicht in der Datenmenge.

Die Funktion createhiddendataset erzeugt eine Datenmenge, die diese Eigenschaften simuliert. Sie verwirft ein paar der verkomplizierenden ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.