Kapitel 12. Datenprodukte mit JSON-Schema entwerfen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Alles wird entworfen. Nur wenige Dinge sind gut gestaltet.

Brian Reed, renommierter Industriedesigner

In Kapitel 4 wurde die Idee eines Datenprodukts als ein in sich geschlossenes Objekt mit vier Facetten vorgestellt: Daten, Struktur, Bedeutung und Kontext. In der Praxis werden einige dieser Facetten oft ignoriert. Datenwissenschaftler/innen erhalten zum Beispiel Sammlungen von CSV-Dateien mit inkonsistenten Zeilen und unzureichenden Informationen darüber, was die einzelnen Spalten bedeuten, wann der Datensatz erstellt wurde usw. Das Fehlen dieser Facetten führt zu Mehrdeutigkeit, so dass es extrem schwierig ist, aus diesen schlecht gestalteten Datenquellen wichtige Erkenntnisse zu gewinnen, ganz gleich, wie viel teure Tools oder Fachwissen für diese Aufgabe eingesetzt werden.

Um dieses Datenproblem zu lösen, hast du eine bewährte Methode gelernt, um eine Angleichung in deinem Unternehmen zu erreichen. Du hast auch die grundlegenden Technologien kennengelernt, die diese Methode anwendbar machen: JSON und JSON Schema. In diesem Kapitel setzen wir all das in die Praxis um, indem wir dir zeigen, wie du mit JSON und JSON Schema ein Datenprodukt mit einem konzeptbasierten Ansatz entwickelst. Wir werden die einzelnen Aspekte eines Datenprodukts der Reihe nach betrachten und dabei auf der JSON-Schema-Registry ...

Get Vereinheitlichung von Geschäft, Daten und Code now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.