Kapitel 6. Behebung von Datenqualitätsproblemen im großen Maßstab
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Stell dir Folgendes vor: Es ist Freitag um 17 Uhr und du bist kurz davor, dich für den Tag abzumelden. Du fängst an, deine Tabs zu schließen, deine Tasche zu packen und dich auf das Wochenende einzustellen. Gerade als du deinen Laptop ausschalten willst, erhältst du eine dringende Slack-Nachricht von deinem CFO über ein defektes Dashboard.
"Die Zahlen in unserem Quartalsbericht sind falsch", schimpft sie dich. "Ich habe das nicht abgesegnet!"
Wenn du davon ausgehst, dass das Problem mit den Daten selbst zu tun hat und nicht mit den schlampigen Finanzdaten deines Unternehmens, hast du einen schweren Fall von Datenausfall. Du öffnest Looker und stellst fest, dass sie Recht hat - der Bericht sieht ganz anders aus und du hast keine Ahnung, warum. Du hast die Zahlen gestern gemeinsam mit ihr überprüft. Deine Diagramme und Schaubilder haben vor Genauigkeit nur so gestrahlt.
Du rufst die Quelldaten auf (eine Excel-Tabelle auf deinem Desktop, "Finanzbericht V. 212 GUT_I_ PROMISE_YES_GOOD"), aber das verwirrt dich noch mehr. Dutzende von E-Mails, zwei Telefonate, ein paar Zoom-Meetings und sieben Stunden später hast du den Schuldigen für das fehlerhafte Dashboard gefunden: eine Schemaänderung in einer Quelltabelle.
Toll, du hast herausgefunden, was passiert ist - was nun?
Für die meisten Datenteams ...
Get Grundlagen der Datenqualität now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.