Kapitel 2. Metadaten-Katalogdienst

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Angenommen, ein Datennutzer möchte ein Umsatz-Dashboard entwickeln. Im Gespräch mit anderen Datenanalysten und Wissenschaftlern stößt er auf einen Datensatz mit Details zu Kundenabrechnungen. In diesem Datensatz stößt er auf ein Attribut namens "Abrechnungssatz". Was ist die Bedeutung dieses Attributs? Ist es die Quelle der Wahrheit oder stammt es aus einem anderen Datensatz? Es stellen sich noch viele andere Fragen, wie z. B.: Wie ist das Schema der Daten? Wer verwaltet sie? Wie wurden sie umgewandelt? Wie zuverlässig ist die Datenqualität? Wann wurden sie aktualisiert? und so weiter. Es gibt keinen Mangel an Daten im Unternehmen, aber die Nutzung der Daten zur Lösung von Geschäftsproblemen ist heute eine große Herausforderung. Denn um Erkenntnisse in Form von Dashboards und ML-Modellen zu gewinnen, muss man die Eigenschaften der Daten (die so genannten Metadaten) genau kennen. Ohne umfassende Metadaten kann man falsche Annahmen über die Bedeutung der Daten und ihre Qualität machen, was zu falschen Erkenntnissen führt.

Die Beschaffung zuverlässiger Metadaten ist ein Problem für Datennutzer. Vor der Big-Data-Ära wurden die Daten kuratiert, bevor sie dem zentralen Warehouse hinzugefügt wurden - die Details der Metadaten, einschließlich des Schemas, der Herkunft, der Eigentümer, der Geschäftstaxonomie usw., wurden ...

Get Die Self-Service-Daten-Roadmap now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.