Capítulo 8. Zero-ETL ou Quase-Zero-ETL
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
No Capítulo 7, apresentamos as bases de dados híbridas emergentes que fornecem soluções alternativas para suportar a análise em tempo real. Estes sistemas reduzem a infraestrutura e tornam os dados mais acessíveis às cargas de trabalho analíticas. Como os sistemas híbridos convergem sistemas que são tradicionalmente distribuídos, supõe-se que os sistemas híbridos se inclinam para um sistema monólito. Os sistemas monólitos são normalmente conhecidos pela falta de modularidade e escalabilidade na execução de cargas de trabalho de dados.
Ironicamente, a quebra de um sistema de dados monólito vai fazer-nos voltar a decompor uma base de dados e virá-la do avesso para escalar especificamente os componentes individuais. Esta não é necessariamente uma solução negativa. Neste livro, propusemos colocar esses sistemas de volta na base de dados para reduzir a complexidade e o custo, que são tradicionalmente associados a grandes sistemas distribuídos.
A ETL é a forma como movemos os dados de sistema para sistema, transformando-os ao longo do caminho. Até agora, usámos uma forma de ETL chamada streaming SQL. Neste capítulo, falaremos sobre como equilibrar complexidade e escalabilidade na implementação do ETL, analisando os sistemas e padrões existentes usados atualmente para distribuir e escalar cargas de trabalho de dados.
Modelo ETL ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access