Capítulo 3. Conceber uma boa arquitetura de dados
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Uma boa arquitetura de dados fornece capacidades contínuas em todas as etapas do ciclo de vida dos dados e da corrente subjacente. Começaremos por definir a arquitetura de dados e, em seguida, discutiremos os componentes e as considerações. Em seguida, abordaremos padrões específicos de lote (data warehouses, data lakes), padrões de streaming e padrões que unificam lote e streaming. Durante todo o processo, enfatizaremos o aproveitamento dos recursos da Cloud para oferecer escalabilidade, disponibilidade e confiabilidade.
O que é a arquitetura de dados?
A engenharia de dados bem-sucedida é construída com base numa arquitetura de dados sólida. Este capítulo tem como objetivo analisar algumas abordagens e estruturas de arquitetura populares e, em seguida, elaborar a nossa definição opinativa do que é uma "boa" arquitetura de dados. De facto, não vamos deixar toda a gente satisfeita. Ainda assim, apresentaremos uma definição pragmática, específica do domínio e funcional para a arquitetura de dados que, na nossa opinião, funcionará em empresas com escalas, processos empresariais e necessidades muito diferentes.
O que é a arquitetura de dados? Quando paramos para desvendar o assunto, ele se torna um pouco obscuro; pesquisar sobre arquitetura de dados gera muitas definições inconsistentes e, muitas vezes, desatualizadas. ...