Capítulo 6. Profundización en los formatos de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
El diseño no es sólo lo que parece y lo que se siente. El diseño es cómo funciona.
Steve Jobs
Tradicionalmente, los almacenes de datos se construyen sobre un formato de datos propio que aprovechan para optimizar los patrones de consulta. Dado el creciente número de escenarios a los que sirve el lago de datos en la nube, especialmente con el auge del patrón arquitectónico lakehouse, cada vez más clientes y proveedores de soluciones están invirtiendo en capacidades que permitan ejecutar consultas similares a las de un almacén directamente en el lago de datos en la nube. Esto nos acerca a la promesa de ofrecer una arquitectura que minimice la necesidad de copiar datos de un lado a otro de los almacenes de datos para fines específicos. Esta promesa de un almacenamiento de datos sin silos ha dado lugar a un número creciente de formatos de datos abiertos que permiten ejecutar consultas tipo almacén directamente en un almacenamiento de lago de datos en la nube. En este capítulo, echaremos un vistazo a tres de estos formatos: Apache Iceberg, Delta Lake y Apache Hudi. Este capítulo es probablemente el más técnico del libro, donde examinamos los formatos con gran detalle, incluyendo cómo sirven a los escenarios para los que están diseñados. Mi esperanza es que este capítulo te proporcione suficientes conocimientos sobre ...
Get El lago de datos en la nube now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.