Kapitel 18. Semistrukturierte Daten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Relationale Datenbanken können mit komplexen Konzepten und Beziehungen umgehen, aber nicht alle Daten lassen sich leicht als Zeilen und Spalten ausdrücken. Semistrukturierte Datenformate wie XML, Parquet, Avro und JSON ermöglichen eine flexible Speicherung von Daten, ohne dass sie einem vordefinierten Schema entsprechen müssen. Im Gegensatz zu anderen Datenbankservern, bei denen die Unterstützung für semistrukturierte Daten erst nachträglich hinzugefügt wurde, wurde die Architektur von Snowflake von Anfang an so konzipiert, dass sowohl strukturierte als auch semistrukturierte Daten unterstützt werden. Dieses Kapitel befasst sich mit der Erstellung, Speicherung und Abfrage von JSON-Dokumenten in Snowflake.

JSON aus relationalen Daten generieren

JSON (JavaScript Object Notation) hat sich zum Standard Format für den Datenaustausch entwickelt. Es ist sowohl für Menschen als auch für Maschinen leicht zu lesen und zu schreiben, und obwohl es XML ähnelt, ist es weniger langatmig und daher kompakter. JSON speichert Daten als Schlüssel-Wert-Paare, so dass die Daten selbstbeschreibend sind und kein externes Schema benötigt wird. JSON-Dokumente können aus relationalen Tabellen erzeugt, in Tabellen mit dem Datentyp variant gespeichert und mit integrierten Funktionen wie flatten() abgefragt werden.

Beginnen wir mit der Erstellung ...

Get Snowflake SQL und Skripting lernen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.