Kapitel 2. Datenqualität

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

80 % meiner Zeit habe ich damit verbracht, die Daten zu bereinigen. Bessere Daten werden immer bessere Modelle schlagen.

Thomson Nguyen

Daten ist die Grundlage für eine datengesteuerte Organisation.

Wenn du nicht über aktuelle, relevante und vertrauenswürdige Daten verfügst, bleibt den Entscheidungsträgern nichts anderes übrig, als Entscheidungen aus dem Bauch heraus zu treffen. Datenqualität ist der Schlüssel.

Hinweis

In diesem Kapitel verwende ich den Begriff "Qualität" in einem sehr weiten Sinne und betrachte ihn hauptsächlich aus der Perspektive eines Analysten.

Analysten brauchen die richtigen Daten, die auf die richtige Weise, in der richtigen Form, am richtigen Ort und zur richtigen Zeit gesammelt werden. (Sie verlangen nicht viel.) Wenn einer dieser Aspekte fehlt, können die Analysten nur wenige Fragen beantworten und nur wenige Erkenntnisse aus den Daten gewinnen.

In diesem und dem nächsten Kapitel werde ich das umfassende Thema Datenqualität behandeln. Zunächst werde ich erörtern, wie man sicherstellt, dass die Datenerhebung richtig durchgeführt wird. Das bedeutet Qualität in dem Sinne, dass sie genau, zeitnah, kohärent usw. ist. Im nächsten Kapitel geht es dann darum, wie wir sicherstellen, dass wir die richtigen Daten sammeln. Qualität bedeutet hier, dass wir die besten Datenquellen auswählen und bereitstellen, ...

Get Schaffung einer datengesteuerten Organisation now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.