Capítulo 3. Orquestração de dados
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Embora já tenhamos discutido a ingestão(E, L) e a transformação(T), apenas arranhamos a superfície do ETL. Ao contrário de considerar os pipelines de dados como uma série de etapas discretas, existem mecanismos abrangentes que operam em um meta-nível, apropriadamente chamados de "undercurrents" por Matt Housley e Joe Reis em Fundamentals of Data Engineering:
-
Segurança
-
Gerenciamento de dados
-
Operações de dados (DataOps)
-
Arquitetura de dados
-
Orquestração de dados
-
Engenharia de software
Neste capítulo, exploraremos o gerenciamento de dependências e a orquestração de pipeline, abordando a história dos orquestradores, o que é importante para entender por que determinados métodos de orquestração são populares atualmente. Apresentaremos um menu de opções para você orquestrar seus próprios fluxos de trabalho de dados e discutiremos alguns padrões de design comuns na orquestração.
Ao longo da discussão, você verá como um "orquestrador" tem sido historicamente separado de uma ferramenta de "transformação". Falaremos sobre por que isso tem sido verdade e por que pode não ser verdade no futuro, embora ainda acreditemos que um orquestrador separado seja a abordagem preferida.
O que é orquestração de dados?
Todo fluxo de trabalho, de dados ou não, requer etapas sequenciais: tentar usar uma prensa francesa sem aquecer a água ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access