Overview
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los patrones tradicionales de arquitectura de datos están muy limitados. Para utilizar estos patrones, tienes que ETL los datos en cada herramienta, un proceso de coste prohibitivo para hacer que las funciones del almacén estén disponibles para todos tus datos. La falta de flexibilidad de estos patrones te obliga a encerrarte en un conjunto de herramientas y formatos prioritarios, lo que crea silos de datos y deriva de datos. Este práctico libro te muestra una forma mejor.
Apache Iceberg proporciona las capacidades, el rendimiento, la escalabilidad y el ahorro que cumplen la promesa de un lago de datos abierto. Siguiendo las lecciones de este libro, podrás realizar análisis interactivos, por lotes, de aprendizaje automático y de streaming con este formato de código abierto de alto rendimiento. Los autores Tomer Shiran, Jason Hughes y Alex Merced de Dremio te muestran cómo empezar con Iceberg.
Con este libro, aprenderás
- La arquitectura de las tablas de Apache Iceberg
- Qué ocurre bajo el capó cuando realizas operaciones en tablas Iceberg
- Cómo optimizar aún más las tablas Iceberg para obtener el máximo rendimiento
- Cómo utilizar Iceberg con motores de datos populares como Apache Spark, Apache Flink y Dremio
Descubre por qué Apache Iceberg es una tecnología fundamental para implementar un lago de datos abierto.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access