Vorwort
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Die meisten Unternehmen, die eine ausreichende Größe und Skalierung erreicht haben, kommen an einen Punkt, an dem sie sich fragen, ob ihre Daten vertrauenswürdig sind. Sie sehen Zahlen auf den Dashboards, die unmöglich stimmen können; aus heiterem Himmel fangen Machine Learning Modelle an, in der Produktion schlecht zu funktionieren. Die Redewendung "garbage in, garbage out" beginnt intern zu kursieren und bezieht sich auf das Problem, Produkte und Funktionen mit Daten zu erstellen, die Fehler, fehlende Segmente und andere Ungenauigkeiten enthalten können.
Wenn das Vertrauen in die Daten des Unternehmens zu schwinden beginnt - oder vielleicht gar nicht erst vorhanden war -, ist es wichtig, dieses Problem direkt anzugehen. Die Datenqualität verbessert sich nicht auf magische Weise, wenn ein Unternehmen weiter wächst, sondern wird durch die zunehmende Komplexität nur noch schlechter. Genau wie die Softwarequalität muss auch die Datenqualität ständig überwacht werden, damit Probleme schnell behoben werden können, sobald sie auftreten.
Viele Unternehmen sind in der Theorie mit dieser Idee einverstanden, haben aber Schwierigkeiten, die Überwachung der Datenqualität in der Praxis und auf Unternehmensebene umzusetzen. Als Jeremy und Elliott 2018 Anomalo gründeten, taten sie das, weil sie aus erster Hand erfahren hatten, dass die bestehenden Ansätze ...