Kapitel 82. Wie man die Datennormalisierung ein- und ausschaltet
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Datennormalisierung ist der Prozess der Anpassung von Werten aus verschiedenen Skalen an eine gemeinsame Skala, um einen besseren Vergleich der Werte zu ermöglichen. Betrachtet man zum Beispiel verschiedene Kennzahlen wie "Gesamtzahl der pro Jahr gegessenen Cheeseburger pro US-Bundesstaat", "Gesamtzahl der pro Jahr verteilten High Fives pro US-Bundesstaat" und "Gesamtzahl der pro Jahr genommenen Urlaubstage pro US-Bundesstaat", wird man feststellen, dass Kalifornien in allen drei Kategorien an der Spitze liegt. Das hört sich so an, als wäre Kalifornien der beste Ort in den USA, und vielleicht ist das auch so, aber diese Ergebnisse sind höchstwahrscheinlich darauf zurückzuführen, dass Kalifornien die höchste Bevölkerungszahl hat (d.h. mehr Menschen, die sich gegenseitig ein High Five geben).
Eine bessere Analyse wäre, zu ermitteln, wie viele High Fives pro Person und Jahr in den einzelnen US-Bundesstaaten vergeben werden. Es gibt verschiedene Möglichkeiten, Daten in Tableau zu normalisieren, z. B. die Aggregation einer Kennzahl zu ändern, einen berechneten 100-Punkte-Index zu erstellen oder eine gemeinsame Basislinie festzulegen. Manchmal ist es auch sinnvoll, die rohen, nicht normalisierten Zahlen zu sehen, damit unsere Endnutzer den Kontext der ursprünglichen Skalen sehen können. ...
Get Innovative Tabelle now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.