Skip to Content
Data Pipelines Pocket Reference
book

Data Pipelines Pocket Reference

by James Densmore
September 2024
Intermediate to advanced
276 pages
5h 36m
German
O'Reilly Media, Inc.
Content preview from Data Pipelines Pocket Reference

Kapitel 7. Pipelines orchestrieren

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In den vorangegangenen Kapiteln wurden die Bausteine von Datenpipelines beschrieben, darunter die Dateneingabe, die Datenumwandlung und die Schritte in einer Pipeline für maschinelles Lernen. In diesem Kapitel geht es darum, wie man diese Bausteine oder Schritte "orchestriert" oder miteinander verbindet.

Die Orchestrierung stellt sicher, dass die Schritte in einer Pipeline in der richtigen Reihenfolge ausgeführt werden und dass die Abhängigkeiten zwischen den Schritten richtig verwaltet werden.

Als ich in Kapitel 2 auf die Herausforderung der Orchestrierung von Pipelines eingegangen bin, habe ich auch das Konzept der Workflow-Orchestrierungsplattformen (auch Workflow-Management-Systeme (WMS), Orchestrierungsplattformen oder Orchestrierungs-Frameworks genannt) vorgestellt. In diesem Kapitel werde ich Apache Airflow vorstellen, eines der beliebtesten Frameworks dieser Art. Auch wenn der Großteil des Kapitels den Beispielen in Airflow gewidmet ist, lassen sich die Konzepte auch auf andere Frameworks übertragen. Im weiteren Verlauf des Kapitels stelle ich sogar einige Alternativen zu Airflow vor.

In den späteren Abschnitten dieses Kapitels werden einige fortgeschrittene Konzepte der Pipeline-Orchestrierung besprochen, darunter die Koordination mehrerer Pipelines in deiner Dateninfrastruktur.

Gerichtet azyklische Graphen ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Data Pipelines Pocket Reference

Data Pipelines Pocket Reference

James Densmore
Implementing Data Mesh

Implementing Data Mesh

Jean-Georges Perrin, Eric Broda
Building Machine Learning Pipelines

Building Machine Learning Pipelines

Hannes Hapke, Catherine Nelson
Data Pipelines with Apache Airflow

Data Pipelines with Apache Airflow

Bas Harenslak, Julian de Ruiter

Publisher Resources

ISBN: 9781098192129