Arquitetar plataformas de dados e de aprendizagem automática
by Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner
Capítulo 7. Convergindo para uma casa no lago
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Como já sabes, existem duas abordagens principais que as organizações podem adotar ao conceber a sua plataforma de dados: seguir um lago de dados ou um paradigma DWH. Ambas as abordagens têm prós e contras, mas a questão é: é possível fazer com que ambas as tecnologias coexistam para ter uma arquitetura convergente? Neste capítulo, exploraremos esse tópico, começando com uma breve motivação para essa ideia e, em seguida, analisaremos duas variantes amplas da arquitetura convergente - conhecida comoarquitetura lakehouse - eajudaremos você a decidir como escolher entre elas.
O conceito de lakehouse está se tornando cada vez mais popular porque permite uma maneira mais flexível e escalável de armazenar e analisar dados estruturados, semiestruturados e não estruturados em escala. Um lakehouse pode lidar com todo o ciclo de vida dos dados estruturados e não estruturados, combinando o melhor das abordagens de data lake e DWH que aprendeste nos dois capítulos anteriores de uma forma governada. No final deste capítulo, descreveremos como evoluir para a arquitetura de lakehouse.
A necessidade de uma arquitetura única
Os lagos de dados e os DWH surgiram para satisfazer as necessidades de diferentes utilizadores. Uma organização com ambos os tipos de utilizadores vê-se confrontada com uma escolha pouco apelativa.