Skip to Main Content
Apache Iceberg: La Guía Definitiva
book

Apache Iceberg: La Guía Definitiva

by Tomer Shiran, Jason Hughes, Alex Merced
September 2024
Intermediate to advanced content levelIntermediate to advanced
344 pages
9h 43m
Spanish
O'Reilly Media, Inc.
Content preview from Apache Iceberg: La Guía Definitiva

Capítulo 4. Optimizar el rendimiento de las tablas Iceberg

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Como viste en el Capítulo 3, las tablas de Apache Iceberg proporcionan una capa de metadatos que permite al motor de consultas crear planes de consulta más inteligentes para mejorar el rendimiento. Sin embargo, estos metadatos son sólo el principio de cómo puedes optimizar el rendimiento de tus datos.

Tienes varias palancas de optimización a tu disposición, como la reducción del número de archivos de datos, la ordenación de datos, la partición de tablas, la gestión de actualizaciones a nivel de fila, la recopilación de métricas y los factores externos. Estas palancas desempeñan un papel vital en la mejora del rendimiento de los datos, y este capítulo explora cada una de ellas, abordando las posibles ralentizaciones y proporcionando perspectivas de aceleración. Implementar un monitoreo robusto con las herramientas preferidas es crucial para identificar las necesidades de optimización, incluido el uso de las tablas de metadatos de Apache Iceberg, que trataremos en el Capítulo 10.

Compactación

Cada procedimiento o proceso tiene un coste en términos de tiempo, lo que significa consultas más largas y mayores costes de cálculo. Dicho de otro modo, cuantos más pasos tengas que dar para hacer algo, más tiempo tardarás en hacerlo. Cuando consultas tus tablas de Apache Iceberg, tienes que abrir y escanear cada archivo ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Spark: La Guía Definitiva

Spark: La Guía Definitiva

Bill Chambers, Matei Zaharia
Aprender Spark, 2ª Edición

Aprender Spark, 2ª Edición

Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee
MongoDB: La Guía Definitiva, 3ª Edición

MongoDB: La Guía Definitiva, 3ª Edición

Shannon Bradshaw, Eoin Brazil, Kristina Chodorow

Publisher Resources

ISBN: 9781098182595Supplemental Content