9 Data Profiling

Dieses Kapitel zeigt, wie man mit Data Profiling erfolgreich die Datenqualität verbessern kann. Es werden die einzelnen Data-Profiling-Verfahren vorgestellt. Viele praktische Beispiele zeigen, wie man diese richtig einsetzt, die Ergebnisse verwendet und typische Stolperfallen umgeht. Außerdem werden Tipps gegeben, wie man das Data-Profiling-Team richtig zusammenstellt.

Data Profiling ist ein weitgehend automatisierter Prozess zur Analyse vorhandener Datenbestände. Verschiedene Analysetechniken liefern Informationen über Inhalt, Strukturen und Qualität der Daten.

Durch das Data Profiling (siehe Abb. 9–1) werden in erster Linie die existierenden Metadaten an den vorhandenen Echtdaten validiert und neue Metadaten gefunden. Zusätzlich ...

Get Datenqualität erfolgreich steuern now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.