Kapitel 1. Der Imperativ der Datenqualität
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Im März 2022 migrierte Equifax seine Daten von lokalen Systemen auf eine neue Cloud-Infrastruktur - ein bekanntermaßen schwieriger Prozess. Dabei kam es zu einem Fehler, der sich auf die Berechnung der Kreditwürdigkeitswerte auswirkte. Etwa 12 % aller Kreditwürdigkeitsdaten des Unternehmens waren davon betroffen, und Hunderttausende von Menschen hatten am Ende einen um 25 oder mehr Punkte falschen Wert. In Unkenntnis des Fehlers änderten Kreditinstitute, die die Daten von Equifax nutzten, die Zinssätze, die sie ihren Kunden anboten, und lehnten sogar Kredit- und Hypothekenanträge ab, die eigentlich hätten genehmigt werden müssen.
Leider ist das nicht das einzige Problem mit der Datenqualität, das in letzter Zeit in den Nachrichten aufgetaucht ist:
-
Im Jahr 2020 gingen aufgrund eines Datenfehlers fast 16.000 positive COVID-19-Testergebnisse im Vereinigten Königreich verloren, was möglicherweise dazu führte, dass 50.000 Menschen nicht zur Selbstisolierung aufgefordert wurden.
-
Sogenannte "Fehltarife", die manchmal unbeabsichtigt um mehr als 90 % ermäßigt sind, haben die Fluggesellschaften gezwungen, entweder Geld zu verlieren oder ihren Ruf zu schädigen, indem sie diese "Fehltarife" nicht einhalten.
-
Facebook hat einer Gruppe von Sozialwissenschaftlern einen Datensatz zur Verfügung gestellt, in dem die ...