Capítulo 3. Armazenamento: O coração da casa do lago
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
A camada de armazenamento é o coração de qualquer plataforma de dados. Nas plataformas baseadas na arquitetura lakehouse, desempenha um papel importante na persistência eficiente de todos os tipos de dados e na melhoria do desempenho das consultas. A camada de armazenamento da lakehouse consiste em armazenamento em Cloud, formatos de ficheiro e formatos de tabela. Neste capítulo, vamos nos concentrar em entender esses conceitos e as tecnologias disponíveis para implementar a camada de armazenamento lakehouse.
Explicarei os conceitos fundamentais relacionados com o armazenamento em lago, a diferença entre armazenamentos em linha e em coluna e como o armazenamento está intimamente associado ao desempenho. Em seguida, vamos aprofundar os formatos de ficheiro utilizados para armazenar dados para casos de utilização de análise, as vantagens de utilizar cada formato e as principais caraterísticas que deves considerar ao criar uma plataforma de dados.
Quando compreenderes estes conceitos, será mais fácil discutir o tópico principal deste capítulo - os formatos de tabela aberta. Discutiremos os principais formatos de tabela, suas caraterísticas e benefícios, e as limitações específicas que deves ter em mente ao tomar qualquer decisão de design.
Na última secção deste capítulo, abordarei as principais considerações ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access