Overview
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Datenpipelines sind die Grundlage für den Erfolg in der Datenanalytik. Das Verschieben von Daten aus zahlreichen verschiedenen Quellen und ihre Umwandlung in einen Kontext ist der Unterschied zwischen dem Besitz von Daten und der tatsächlichen Nutzung dieser Daten. Dieses Nachschlagewerk definiert Datenpipelines und erklärt, wie sie im modernen Data Stack von heute funktionieren.
Du lernst allgemeine Überlegungen und wichtige Entscheidungspunkte bei der Implementierung von Pipelines kennen, z. B. Batch- oder Streaming-Dateneingabe und Build versus Buy. Dieses Buch befasst sich mit den häufigsten Entscheidungen, die von Datenexperten getroffen werden, und behandelt grundlegende Konzepte, die für Open-Source-Frameworks, kommerzielle Produkte und selbst entwickelte Lösungen gelten.
Du wirst lernen:
- Was eine Datenpipeline ist und wie sie funktioniert
- Wie Daten auf modernen Dateninfrastrukturen, einschließlich Cloud-Plattformen, bewegt und verarbeitet werden
- Gängige Tools und Produkte, die von Dateningenieuren zum Aufbau von Pipelines verwendet werden
- Wie Pipelines Analyse- und Berichtsanforderungen unterstützen
- Überlegungen zur Wartung, Prüfung und Alarmierung von Pipelines
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access