Kapitel 4. Dateneingabe: Daten extrahieren
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Wie in Kapitel 3 erläutert, ist das ELT-Muster das ideale Design für Datenpipelines, die für Datenanalyse, Data Science und Datenprodukte entwickelt werden. Die ersten beiden Schritte des ELT-Patterns, das Extrahieren und das Laden, werden zusammenfassend als Dateneingabe bezeichnet. In diesem Kapitel geht es darum, wie du deine Entwicklungsumgebung und Infrastruktur für beides einrichtest und wie du Daten aus verschiedenen Quellsystemen extrahierst. Kapitel 5 befasst sich mit dem Laden der resultierenden Datensätze in ein Data Warehouse.
Hinweis
Die Codebeispiele zum Extrahieren und Laden in diesem Kapitel sind vollständig voneinander entkoppelt. Die Koordinierung der beiden Schritte zur Datenübernahme ist ein Thema, das in Kapitel 7 behandelt wird.
Wie in Kapitel 2 erläutert, gibt es zahlreiche Arten von Quellsystemen, aus denen Daten extrahiert werden können, und zahlreiche Zielsysteme, in die sie geladen werden müssen. Außerdem liegen die Daten in vielen verschiedenen Formen vor, die alle unterschiedliche Herausforderungen für die Datenaufnahme mit sich bringen.
Dieses und das nächste Kapitel enthalten Codebeispiele für den Export und die Aufnahme von Daten aus und in gängige Systeme. Der Code ist stark vereinfacht und enthält nur eine minimale Fehlerbehandlung. Jedes Beispiel ist als leicht verständlicher ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access