Kapitel 3. Grundlegende Operationen an Delta-Tabellen
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Deltatabellen können auf verschiedene Arten erstellt werden. Wie du deine Tabellen erstellst, hängt weitgehend davon ab, wie gut du mit dem Toolset vertraut bist. Wenn du in erster Linie ein SQL-Entwickler bist, kannst du die CREATE TABLE verwenden, um eine Deltatabelle zu erstellen, während Python-Nutzer vielleicht die DataFrameWriter API oder die feinkörnige und einfach zu verwendende DeltaTableBuilder API bevorzugen.
Bei der Erstellung von Tabellen kannst du GENERATED Spalten definieren, deren Werte automatisch auf der Grundlage einer benutzerdefinierten Funktion über andere Spalten in der Deltatabelle generiert werden. Auch wenn es einige Einschränkungen gibt, sind die generierten Spalten eine leistungsstarke Möglichkeit, deine Deltatabellenschemata zu bereichern.
Deltatabellen können mit ANSI-SQL oder mit der beliebten PySpark DataFrameReader API gelesen werden. Du kannst mit der klassischen SQL-Anweisung INSERT in eine Deltatabelle schreiben oder einen Datenrahmen an die Tabelle anhängen. Schließlich ist die Option SQL COPY INTO eine gute Möglichkeit, große Datenmengen schnell anzuhängen.
Die Partitionierung einer Deltatabelle auf der Grundlage deiner häufig verwendeten Abfragemuster kann deine Abfrage- und DML-Leistung erheblich verbessern. Die einzelnen Dateien, aus denen deine Deltatabelle ...