Kapitel 3. Datenqualität verstehen
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Daten sind überall. Sie werden automatisch von unseren mobilen Geräten, unseren Einkäufen und unseren Bewegungen erzeugt. Sie werden von unseren Stromzählern, öffentlichen Verkehrssystemen und der Kommunikationsinfrastruktur erfasst. Und sie werden genutzt, um unseren Gesundheitszustand, unser Einkommenspotenzial und unsere Kreditwürdigkeit einzuschätzen.1 Wirtschaftswissenschaftler haben sogar erklärt, dass Daten das "neue Öl" sind.2 denn sie haben das Potenzial, so viele Aspekte des menschlichen Lebens zu verändern.
Während Daten reichlich vorhanden sein mögen, sind gute Daten in Wahrheit rar. Der Anspruch der "Datenrevolution" ist, dass wir mit genügend Daten die Gegenwart besser verstehen und die Zukunft verbessern oder sogar vorhersagen können. Damit das überhaupt möglich ist, müssen die Daten, die diesen Erkenntnissen zugrunde liegen, von hoher Qualität sein. Ohne qualitativ hochwertige Daten werden all unsere Bemühungen, sie zu sammeln, zu analysieren, zu visualisieren und zu kommunizieren, im besten Fall dazu führen, dass wir nicht mehr über die Welt wissen als zu Beginn. Das wäre zwar eine bedauerliche Verschwendung, aber noch schlimmer ist es, wenn uns die Erkenntnis fehlt, dass unsere Daten von schlechter Qualität sind. Da datengesteuerte Systeme dazu dienen, Entscheidungen in großem Umfang zu treffen, ...
Get Praktisches Python Data Wrangling und Datenqualität now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.