Capítulo 2. La arquitectura de Apache Iceberg
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En este capítulo, hablaremos de la arquitectura y de las especificaciones que permiten a Apache Iceberg resolver los problemas inherentes al formato de tabla Hive, mirando bajo las cubiertas de una tabla Iceberg. Cubriremos las diferentes estructuras de una tabla Iceberg y lo que cada estructura proporciona y permite, de modo que puedas comprender lo que ocurre bajo el capó, así como diseñar de la mejor manera posible tu casa del lago basada en Apache Iceberg.
Como se mencionó en el Capítulo 1, hay tres capas diferentes en una tabla Iceberg de Apache: la capa de catálogo, la capa de metadatos y la capa de datos. La Figura 2-1 muestra los distintos componentes que forman cada capa.
En las secciones siguientes, repasaremos cada uno de estos componentes en detalle. Como puede ser más fácil entender conceptos nuevos para ti empezando por uno conocido, trabajaremos de abajo arriba, empezando por la capa de datos.
Figura 2-1. La arquitectura de una tabla Iceberg de Apache
La capa de datos
La capa de datos de una tabla Apache Iceberg es la que almacena los datos reales de la tabla y está formada principalmente por los propios archivos de datos, aunque también se incluyen los archivos de borrado. La capa de datos es la que ...