Skip to Content
Apache Iceberg: La Guía Definitiva
book

Apache Iceberg: La Guía Definitiva

by Tomer Shiran, Jason Hughes, Alex Merced
September 2024
Intermediate to advanced
344 pages
9h 43m
Spanish
O'Reilly Media, Inc.
Content preview from Apache Iceberg: La Guía Definitiva

Prólogo de Raghu Ramakrishnan

Apache Iceberg es uno de los principales formatos abiertos para tablas actualizables basadas en Parquet, que están emergiendo como el nuevo estándar de almacenamiento de datos para analítica. Históricamente, las bases de datos relacionales han almacenado los datos fila por fila, empaquetados en páginas físicas para una E/S eficiente. Sin embargo, los formatos de tablas columnares han demostrado ser mucho más eficientes para cargas de trabajo de consulta intensiva. Los lagos de datos empezaron soportando consultas sobre formatos columnares como Parquet, pero, por supuesto, las actualizaciones transaccionales también deben soportarse eficientemente para hacer frente a los escenarios de almacén tradicionales. Iceberg está emergiendo como una opción popular de formato de tabla que soporta escenarios que requieren cargas de trabajo de consulta intensiva mezcladas con actualizaciones e ingestas masivas.

Este libro oportuno y bien escrito hace un excelente trabajo de presentación de Iceberg, empezando por lo básico y extendiéndose a la arquitectura y a cómo obtener el mejor rendimiento para una amplia gama de cargas de trabajo, incluidas las consultas SQL en Apache Spark y Dremio, así como el procesamiento de flujos en Apache Flink. También incluye un capítulo en el que se examina Iceberg en entornos de producción, incluido el uso de tablas de metadatos y funciones como ramificación, partición e instantáneas para manejar escenarios complejos a escala. Debería ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Spark: La Guía Definitiva

Spark: La Guía Definitiva

Bill Chambers, Matei Zaharia
Construyendo Arquitecturas Evolutivas, 2ª Edición

Construyendo Arquitecturas Evolutivas, 2ª Edición

Neal Ford, Rebecca Parsons, Patrick Kua, Pramod Sadalage
Aprender Spark, 2ª Edición

Aprender Spark, 2ª Edición

Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee

Publisher Resources

ISBN: 9781098182595