Capítulo 4. Catálogos de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
La capa de almacenamiento dentro de la arquitectura Lakehouse es importante, ya que almacena los datos de toda la plataforma. Para buscar, explorar y descubrir estos datos almacenados, los usuarios necesitan un catálogo de datos. Este capítulo se centrará en comprender un catálogo de datos y el proceso general de gestión de metadatos que permite a los usuarios de la plataforma lakehouse buscar y acceder a los datos.
En la primera sección de este capítulo, explicaré conceptos fundamentales como metadatos, metastore y catálogos de datos. No son conceptos nuevos; las organizaciones llevan mucho tiempo implantando catálogos de datos tanto en los almacenes de datos tradicionales como en las plataformas de datos modernas. Explicaré primero estos conceptos básicos para preparar nuestro debate sobre las funciones avanzadas más adelante en el capítulo.
Discutiremos en qué se diferencian los catálogos de datos en la arquitectura lakehouse, en comparación con las arquitecturas tradicional y combinada, y cómo ayudan a los usuarios a obtener una visión unificada de todos los metadatos. También hablaremos de las ventajas adicionales de los catálogos de datos en la arquitectura lakehouse, que permiten a los usuarios aprovechar los metadatos para implantar un mecanismo unificado de gobierno de datos, control de permisos, linaje y uso compartido.