Skip to Content
Referência de bolso de pipelines de dados
book

Referência de bolso de pipelines de dados

by James Densmore
April 2025
Intermediate to advanced
276 pages
5h 26m
Portuguese (Portugal, Brazil)
O'Reilly Media, Inc.
Book available
Content preview from Referência de bolso de pipelines de dados

Capítulo 4. Ingestão de dados: Extração de dados

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Conforme discutido no Capítulo 3, o padrão ELT é o design ideal para pipelines de dados criados para análise de dados, ciência de dados e produtos de dados. As duas primeiras etapas do padrão ELT, extrair e carregar, são coletivamente chamadas de ingestão de dados. Este capítulo discute a configuração do ambiente de desenvolvimento e da infraestrutura para ambos, e aborda as especificidades da extração de dados de vários sistemas de origem. O Capítulo 5 discute o carregamento dos conjuntos de dados resultantes em um data warehouse.

Nota

Os exemplos de código de extração e carregamento neste capítulo são totalmente desacoplados um do outro. Coordenar as duas etapas para concluir uma ingestão de dados é um tópico discutido no Capítulo 7.

Conforme discutido no Capítulo 2, existem vários tipos de sistemas de origem para extrair, bem como vários destinos para carregar. Além disso, os dados têm muitas formas, todas elas apresentando diferentes desafios para a sua ingestão.

Este capítulo e o seguinte incluem exemplos de código para exportar e ingerir dados de e para sistemas comuns. O código é altamente simplificado e contém apenas um tratamento mínimo de erros. Cada exemplo pretende ser um ponto de partida fácil de entender para a ingestão de dados, mas é totalmente funcional e extensível a soluções mais escaláveis. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Engenharia de dados financeiros

Engenharia de dados financeiros

Tamer Khraisha
Bases de dados de grafos, 2ª edição

Bases de dados de grafos, 2ª edição

Ian Robinson, Jim Webber, Emil Eifrem
Processamento de fluxo com o Apache Flink

Processamento de fluxo com o Apache Flink

Fabian Hueske, Vasiliki Kalavri

Publisher Resources

ISBN: 9798341642218