Kapitel 3. Speicherung: Das Herz des Seehauses
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Die Speicherung ist das Herzstück einer jeden Datenplattform. In Plattformen, die auf der Lakehouse-Architektur basieren, spielt sie eine wichtige Rolle bei der effizienten Speicherung aller Arten von Daten und der Verbesserung der Leistung von Abfragen. Die Lakehouse-Speicherschicht besteht aus Cloud-Speichern, Dateiformaten und Tabellenformaten. In diesem Kapitel konzentrieren wir uns darauf, diese Konzepte und die verfügbaren Technologien zur Implementierung der Lakehouse Speicherung zu verstehen.
Ich erkläre die grundlegenden Konzepte der Lakehouse-Speicherung, den Unterschied zwischen zeilenweiser und spaltenweiser Speicherung und wie die Speicherung eng mit der Leistung zusammenhängt. Anschließend werden wir uns mit den Dateiformaten beschäftigen, die für die Speicherung von Daten für Analysezwecke verwendet werden, mit den Vorteilen der einzelnen Formate und mit den wichtigsten Funktionen, die du beim Aufbau einer Datenplattform berücksichtigen solltest.
Wenn du diese Konzepte verstanden hast, fällt es dir leichter, das Kernthema dieses Kapitels zu besprechen - die offenen Tabellenformate. Wir besprechen die führenden Tabellenformate, ihre Funktionen und Vorteile sowie bestimmte Einschränkungen, die du bei deinen Entscheidungen berücksichtigen solltest.
Im letzten Abschnitt dieses Kapitels gehe ...