book

Analytics Engineering mit SQL und dbt

by Rui Pedro Machado, Helder Russa

September 2024

Intermediate to advanced

324 pages

9h 24m

German

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Warum wir dieses Buch geschrieben habenFür wen dieses Buch istWie dieses Buch aufgebaut istIn diesem Buch verwendete KonventionenCode-Beispiele verwendenO'Reilly Online LearningWie du uns kontaktierstDanksagungen
Datenbanken und ihr Einfluss auf Analytics EngineeringCloud Computing und seine Auswirkungen auf die AnalysetechnikDer Lebenszyklus der DatenanalyseDie neue Rolle des Analytics EngineerVerantwortlichkeiten eines Analytik-IngenieursErmöglichung von Analysen in einem DatengeflechtDaten Produktedbt als Data Mesh EnablerDas Herz der AnalysetechnikDie Legacy-ProzesseSQL und Stored Procedures für ETL/ELT verwendenETL-Tools verwendenDie dbt-RevolutionZusammenfassung
Ein kurzer Überblick über DatenmodellierungDie konzeptionelle Phase der ModellierungDie logische Phase der ModellierungDie physische Phase der ModellierungDer Prozess der DatennormalisierungDimensionale DatenmodellierungModellierung mit dem Star SchemaModellierung mit dem Snowflake SchemaModellierung mit Data VaultMonolithische DatenmodellierungModulare Datenmodelle aufbauenModulare Datenmodelle mit dbt ermöglichenTesten deiner DatenmodelleErzeugen von DatendokumentationDebuggen und Optimieren von DatenmodellenMedaillon-Architektur-MusterZusammenfassung
Die Widerstandsfähigkeit von SQLDatenbank-GrundlagenArten von DatenbankenDatenbank-Management-System"Sprechen" mit einer DatenbankErstellen und Verwalten deiner Datenstrukturen mit DDLManipulation von Daten mit DMLEinfügen von Daten mit INSERTAuswählen von Daten mit SELECTDaten mit UPDATE aktualisierenLöschen von Daten mit DELETESpeichern von Abfragen als AnsichtenGemeinsame TabellenausdrückeFensterfunktionenSQL für verteilte DatenverarbeitungDatenmanipulation mit DuckDBDatenmanipulation mit PolarenDatenmanipulation mit FugueSQLBonus: Training von Machine Learning Modellen mit SQLZusammenfassung
dbt Design Philosophiedbt Datenflussdbt WolkeEinrichten der dbt Cloud mit BigQuery und GitHubVerwendung der dbt Cloud UIVerwendung der dbt Cloud IDEStruktur eines dbt-ProjektsJaffle Shop DatenbankYAML-DateienModelleQuellenTestsAuswertungenSaatgutDokumentationdbt-Befehle und AuswahlsyntaxAufträge und EinsätzeZusammenfassung
Modell MaterialisierungenTabellen, Ansichten und flüchtige ModelleInkrementelle ModelleMaterialisierte AnsichtenSchnappschüsseDynamisches SQL mit JinjaSQL-Makros verwendendbt PaketePakete installierenDas dbt_utils Paket erkundenPakete innerhalb von Makros und Modellen verwendendbt Semantische SchichtZusammenfassung
Problemstellung: Ein Fall von Omnichannel-AnalytikOperative DatenmodellierungKonzeptuelles ModellLogisches ModellPhysikalisches ModellHigh-Level-DatenarchitekturAnalytische DatenmodellierungIdentifiziere die GeschäftsprozesseIdentifiziere Fakten und Dimensionen im dimensionalen DatenmodellIdentifiziere die Attribute für DimensionenDefiniere die Granularität für Business FactsUnser Data Warehouse mit dbt erstellenTests, Dokumentation und Einsatz mit dbtDatenanalyse mit SQLFazit

Content preview from Analytics Engineering mit SQL und dbt

Kapitel 1. Analytik Technik

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Die historische Entwicklung der Analytik umfasst wichtige Meilensteine und Technologien, die den Bereich zu dem gemacht haben, was er heute ist. Es begann mit dem Aufkommen des Data Warehousing in den 1980er Jahren, das den grundlegenden Rahmen für die Organisation und Analyse von Geschäftsdaten schuf. Bill Inmon, ein Informatiker, der in den 1980er und 1990er Jahren immer wieder auf veröffentlichte, gilt als derjenige, der die erste solide theoretische Grundlage für Data Warehousing schuf.

Eine weitere Welle der Entwicklung folgte, als Ralph Kimball, ein weiterer führender Vertreter des Data Warehousing und der Business Intelligence (BI), 1996 sein einflussreiches Werk, The Data Warehouse Toolkit, veröffentlichte. Kimballs Arbeit legte den Grundstein für die dimensionale Modellierung und markierte einen weiteren wichtigen Meilenstein in der Entwicklung der Analytik. Die Beiträge von Inmon und Kimball, die sich über das späte 20. Jahrhundert erstrecken, haben die Landschaft des Data Warehousing und der Analytik entscheidend mitgeprägt.

In den frühen 2000er Jahren entstand mit dem Aufkommen von Tech-Giganten wie Google und Amazon der Bedarf an fortschrittlicheren Lösungen für die Verarbeitung großer Datenmengen, was zur Veröffentlichung des Google File System und Apache Hadoop führte. Dies markierte die Ära des Big Data ...