Capítulo 9. Integração de dados orientados por eventosem dados em repouso
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Os produtos de dados orientados para eventos oferecem uma flexibilidade excecional aos consumidores, mas podem não ser adequados para todos os casos de utilização. Os sistemas e as dependências existentes desempenham um papel importante em qualquer arquitetura, e a mudança para uma malha de dados depende do apoio aos casos de utilização existentes, promovendo simultaneamente mudanças incrementais. Muitos sistemas, tarefas de processamento e cálculos dependem fortemente de dados em repouso, particularmente aqueles no domínio da análise.
Neste capítulo, vamos nos concentrar na integração de dados orientados por eventos em dados em repouso. Examinaremos a arquitetura do Medallion e a função que ela desempenha nos fluxos de trabalho modernos de análise de dados. Exploraremos estratégias e soluções de compromisso para determinar quando converter dados de um fluxo de eventos em um lote de arquivos em repouso. Por fim, analisaremos um exemplo do mundo real para colocar a teoria em prática. Vamos ao que interessa.
A análise e a arquitetura do medalhão
A mudança funciona melhor se primeiro conheceres os teus utilizadores onde eles estão. Os pipelines e fluxos de trabalho de análise de dados baseados em lotes são extremamente comuns na maioria das indústrias, e muitas organizações investiram fortemente ...