Chapitre 4. Catalogues de données
La couche de stockage au sein de l'architecture lakehouse est importante, car elle stocke les données pour l'ensemble de la plateforme. Pour rechercher, explorer et découvrir ces données stockées, les utilisateurs ont besoin d'un catalogue de données. Ce chapitre se concentre sur la compréhension d'un catalogue de données et sur le processus global de gestion des métadonnées qui permet aux utilisateurs de la plateforme lakehouse de rechercher et d'accéder aux données.
Dans la première section de ce chapitre, j'expliquerai des concepts fondamentaux comme les métadonnées, le métastore et les catalogues de données. Ces concepts ne sont pas nouveaux ; les organisations mettent depuis longtemps en œuvre des catalogues de données dans les entrepôts de données traditionnels et les plates-formes de données modernes. J'expliquerai d'abord ces concepts de base afin de préparer notre discussion sur les fonctions avancées plus loin dans le chapitre.
Nous verrons en quoi les catalogues de données diffèrent dans l'architecture lakehouse, par rapport aux architectures traditionnelles et combinées, et comment ils aident les utilisateurs à obtenir une vue unifiée de toutes les métadonnées. Nous discuterons également des avantages supplémentaires des catalogues de données dans l'architecture lakehouse qui permettent aux utilisateurs ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access