Kapitel 13. Spaltennamen als Kontrakte

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Emily Riederer

Softwareprodukte verwenden Unit-Tests und Service-Level-Agreements (SLAs), um Leistungsversprechen abzugeben; Schnittstellen haben gemeinsame Symbole und Bezeichnungen. Datentabellen liegen jedoch irgendwo dazwischen - sie werden weder wie ein Dienst entwickelt noch wie eine Anwendung gestaltet. Das Fehlen von Gesprächen und Verträgen zwischen Herstellern und Verbrauchern führt dazu, dass die Ingenieure verwirrt sind, warum die Nutzer nicht zufrieden sind (oder sich vage über die "Datenqualität" beschweren), und die Verbraucher verwirrt sind, weil die Daten nie ganz "richtig" sind.

Die Verwendung eines kontrollierten Vokabulars für die Benennung von Feldern in veröffentlichten Datensätzen ist eine technisch einfache und reibungslose Lösung für dieses Dilemma. Die Entwicklung einer gemeinsamen Sprache schafft ein gemeinsames Verständnis dafür, wie jedes Feld in einem Datensatz funktionieren soll, und kann außerdem den Aufwand der Produzenten für die Datenvalidierung, die Dokumentation und den Umgang mit den Daten verringern.

Ingenieure und Analysten können im Voraus eine Reihe von Stubs mit atomaren, klar definierten Bedeutungen definieren. Zusammengesetzt können diese Stubs dazu verwendet werden, ...

Get 97 Dinge, die jeder Dateningenieur wissen sollte now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.