Chapitre 3. Stockage : Le cœur de la maison de lac
La couche de stockage est le cœur de toute plateforme de données. Dans les plateformes basées sur l'architecture lakehouse, elle joue un rôle important pour persister efficacement tous les types de données et améliorer les performances des requêtes. La couche de stockage lakehouse se compose du stockage en nuage, des formats de fichiers et des formats de tables. Dans ce chapitre, nous nous attacherons à comprendre ces concepts et les technologies disponibles pour mettre en œuvre la couche de stockage lakehouse.
J'expliquerai les concepts fondamentaux liés au stockage en lac, la différence entre les magasins en ligne et en colonne, et la façon dont le stockage est étroitement associé à la performance. Nous plongerons ensuite en profondeur dans les formats de fichiers utilisés pour stocker les données pour les cas d'utilisation analytiques, les avantages de l'utilisation de chaque format et les caractéristiques clés que tu dois prendre en compte lors de la construction d'une plateforme de données.
Une fois que tu auras compris ces concepts, il te sera plus facile d'aborder le sujet central de ce chapitre : les formats de tableaux ouverts. Nous parlerons des principaux formats de table, de leurs caractéristiques et de leurs avantages, ainsi que des limites spécifiques que tu dois garder à l'esprit lorsque ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access