Kapitel 4. Daten in BigQuery laden
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Im vorherigen Kapitel haben wir die folgende Abfrage geschrieben:
SELECT
state_name
FROM `bigquery-public-data`.utility_us.us_states_area
WHERE
ST_Contains(
state_geom,
ST_GeogPoint(-122.33, 47.61))
Wir haben auch erfahren, dass die Stadt am Standort (-122.33, 47.61) im Bundesstaat Washington liegt. Woher stammen die Daten für state_name und state_geom?
Beachte die FROM Klausel in der Abfrage. Die Eigentümer des bigquery-public-data Projekts hatten die Informationen über die Staatsgrenzen bereits in eine Tabelle namens us_states_area in einem Datensatz namens utility_us geladen. Da das Team den Datensatz utility_us für alle authentifizierten Nutzer von BigQuery freigegeben hat (es sind auch restriktivere Berechtigungen möglich), konnten wir die Tabelle us_states_area in diesem Datensatz abfragen.
Aber wie haben sie die Daten überhaupt in BigQuery bekommen? In diesem Kapitel sehen wir uns verschiedene Möglichkeiten an, Daten in BigQuery zu laden, angefangen bei den Grundlagen.
Die Grundlagen
Datenwerte wie die Grenzen der US-Bundesstaaten ändern sich selten,1 und die Änderungen sind so gering, dass die meisten Anwendungen es sich leisten können, sie zu ignorieren. Im Data-Warehousing-Jargon nennen wir das eine sich langsam verändernde Dimension. Die letzte Änderung der Grenzen der US-Bundesstaaten fand am 1. Januar ...