Capítulo 10. Padrões práticos de design de dados
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
O objetivo deste capítulo é apresentar alguns padrões práticos de design de dados que são úteis na solução de problemas comuns de dados. Vamos nos concentrar em padrões de design reais que são usados em soluções de big data e implantados em ambientes de produção.
Tal como no capítulo anterior, darei exemplos simples para ilustrar a utilização de cada uma delas e mostrar-te-ei como utilizar as transformações do Spark para as implementar. Também falarei mais sobre o conceito de monóides, para te ajudar a entender melhor as transformações de redução.
O melhor livro sobre padrões de desenho disponível é o icónico livro de ciência informáticaDesign Patterns: Elements of Reusable Object-Oriented Software, de Erich Gamma, Richard Helm, Ralph Johnson e John Vlissides (conhecido como The "Gang of Four"). Em vez de apresentar padrões de conceção de dados semelhantes aos do livro "Gang of Four", centrar-me-ei em padrões de conceção de dados práticos e informais que têm sido utilizados em ambientes de produção.
Os padrões de projeto de dados que abordaremos neste capítulo podem nos ajudar a escrever soluções escalonáveis para serem implantadas em clusters do Spark. No entanto, fica ciente de que, quando se trata de adotar e usar padrões de projeto, não existe uma solução mágica. Cada padrão deve ser testado quanto ao desempenho ...