Kapitel 5. Metriken zur Datenqualität und Visualisierung
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In diesem Kapitel wird gezeigt, wie die in Kapitel 4 erstellten Datenqualitätsmetriken nach Anwendung des DQS-Rahmens auf die Datenmengen visualisiert werden können.
Metriken zur Datenqualität
Wie bereits erwähnt, sind Datenqualitätsmetriken die Ergebnisse von Datenqualitätsmessungen, die in der DQS definiert sind und auf deine Daten angewendet werden. In Kapitel 4 haben wir die DQS für die Vollständigkeit auf die rohen Sicherheitsstammdaten angewendet. Die Statistik der Vollständigkeitsprüfung ergibt 25 Datensätze, die aus 11 Datenelementen bestehen und insgesamt 275 Datenwerte enthalten. Daraus ergeben sich 248 gültige, 22 ungültige und 5 verdächtige Datenqualitätskennzahlen für die Dimension Vollständigkeit. Die Metriken für alle DQS, die auf alle Datenelemente im Rohdatenvolumen der Sicherheitsstammdaten angewendet wurden, sind in Tabelle 5-1 zusammengefasst.
Dimension | Datenelement | Gültig | Ungültig | Verdächtiger |
---|---|---|---|---|
Vollständigkeit | Ticker | 22 | 3 | 0 |
Ausgabe Name | 22 | 3 | 0 | |
Tausche | 20 | 5 | 0 | |
Angebot | 23 | 2 | 0 | |
Frag | 21 | 4 | 0 | |
Streue | 25 | 0 | 0 | |
Marktkapitalisierung | 25 | 0 | 0 | |
Marktkapitalisierung Skala | 23 | 2 | 0 | |
Kurs-Gewinn-Verhältnis (KGV) | 22 | 3 | 0 | |
Konsens-Empfehlung ... |
Get Datenqualitätstechnik in Finanzdienstleistungen now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.