Bei der Datensegmentierung geht es immer um den Umgang mit dem Zufallsfehler

Segmentierung nennt man es, wenn Daten in Gruppen aufgespalten werden, und Sie machen das immer dann, wenn Regressionsmodelle für mehrere Untergruppen im Vergleich zum Gesamtmodell zu einem insgesamt geringeren Zufallsfehler führen.

Im Gesamtmodell resultiert aus dem Fehler für Mitarbeiter, die nach weniger als 9% fragen, ein zu breites Intervall für den Schätzwert, wogegen das Fehlerintervall für alle, die nach 9% oder mehr fragen, zu schmal ausfällt!

image with no caption

Als wir uns die einzelnen Bänder angesehen haben, konnten wir feststellen, dass sich der Zufallsfehler in den beiden großen ...

Get Datenanalyse von Kopf bis Fuß now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.