Overview
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Os pipelines de dados são a base para o sucesso da análise de dados. Mover dados de inúmeras fontes diversas e transformá-los para fornecer contexto é a diferença entre ter dados e realmente obter valor a partir deles. Esta referência de bolso define pipelines de dados e explica como eles funcionam na pilha de dados moderna de hoje.
Aprenderás as considerações comuns e os principais pontos de decisão ao implementar pipelines, como a ingestão de dados em lote versus streaming e a construção versus compra. Este livro aborda as decisões mais comuns tomadas por profissionais de dados e discute conceitos fundamentais que se aplicam a estruturas de código aberto, produtos comerciais e soluções caseiras.
Aprenderás:
- O que é um pipeline de dados e como ele funciona
- Como os dados são movidos e processados na infraestrutura de dados moderna, incluindo plataformas Cloud
- Ferramentas e produtos comuns utilizados pelos engenheiros de dados para criar pipelines
- Como é que os pipelines suportam as necessidades de análise e de elaboração de relatórios
- Considerações sobre manutenção, testes e alertas de pipelines