Kapitel 1. Einführung in Datenpipelines
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Hinter jedem glänzenden Dashboard, maschinellen Lernmodell und jeder geschäftsverändernden Erkenntnis stehen Daten. Nicht nur Rohdaten, sondern Daten aus zahlreichen Quellen, die bereinigt, verarbeitet und kombiniert werden müssen, um einen Mehrwert zu schaffen. Die berühmte Redewendung "Daten sind das neue Öl" hat sich bewahrheitet. Genau wie beim Öl liegt der Wert der Daten in ihrem Potenzial, nachdem sie verfeinert und an den Verbraucher geliefert wurden. Und wie beim Öl braucht es effiziente Pipelines, um die Daten durch jede Stufe der Wertschöpfungskette zu bringen.
In dieser Pocket Reference wird erläutert, was diese Datenpipelines sind und wie sie in ein modernes Datenökosystem passen. Sie behandelt allgemeine Überlegungen und wichtige Entscheidungspunkte bei der Implementierung von Pipelines, z. B. Batch- oder Streaming-Dateneingabe, Aufbau oder Kauf von Tools und vieles mehr. Das Buch ist nicht auf eine bestimmte Sprache oder Plattform beschränkt, sondern geht auf die häufigsten Entscheidungen von Datenexperten ein und erörtert grundlegende Konzepte, die für selbst entwickelte Lösungen, Open-Source-Frameworks und kommerzielle Produkte gelten.
Was sind Datenpipelines?
Datenpipelines sind eine Reihe von Prozessen, die Daten aus verschiedenen Quellen zu einem Zielort bewegen und umwandeln, an dem neue ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access