Kapitel 8. BigQuery und Data Warehousing

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Da sich immer mehr Unternehmen auf Echtzeitdaten und Analysen stützen, um Geschäftsentscheidungen zu treffen, werden Data-Warehousing-Techniken immer wichtiger. Als serverloses Data Warehouse im Petabyte-Bereich von Google Cloud ist BigQuery oft die erste und letzte Anlaufstelle für die Speicherung von Daten, groß angelegte Analysen und sogar SQL-basierte Machine Learning-Modelle. Da es sich um einen serverlosen Dienst handelt, müssen keine Cluster erstellt werden. Du lädst deine Daten einfach auf BigQuery hoch und kannst mit der Abfrage beginnen.

BigQuery ist außerdem sehr kosteneffizient, da Rechenleistung und Speicherung getrennt sind und separat skaliert werden können. Wenn du deine Daten nie abfragst, werden dir nur die Kosten für die Speicherung in Rechnung gestellt. Wenn du jedoch Abfragen durchführst, hast du Zugriff auf eine riesige Menge an serverloser Rechenleistung, um deine Daten schnell zu verarbeiten. Und du zahlst nur für die Rechenleistung, die du bei deinen Abfragen nutzt, anstatt für untätige Arbeiter in einem Cluster zu bezahlen.

Die folgenden Rezepte zeigen Beispiele für das Laden von Daten, skalierbare Datenabfragen und Streaming in BigQuery. Sie enthalten Tipps und Tricks, die über die Standard-SQL-Kenntnisse hinausgehen und von denen einige spezifisch für den BigQuery-Dienst und dessen ...

Get Google Cloud Kochbuch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.