Prólogo de Rick Sears
Los datos se han convertido en una parte central de la creación de aplicaciones de software modernas y del crecimiento de las organizaciones modernas basadas en datos. Los ingenieros de datos, los administradores de datos, los analistas de datos y los científicos de datos se encuentran entre las personas de estas organizaciones que desean hacer un mayor uso de sus datos. Muchos de estos profesionales de los datos optan por crear sus aplicaciones basadas en datos en Amazon Web Services (AWS), y a menudo eligen almacenar sus datos en un lago de datos basado en Amazon Simple Storage Service (S3).
Estos clientes pueden querer cambiar y manipular sus datos a lo largo del tiempo sin dejar de hacer uso de los datos mientras cambian y, por tanto, construir sus aplicaciones con soporte para tecnologías de lagos de datos transaccionales. Apache Iceberg es una tecnología clave utilizada por los clientes de AWS que construyen lagos de datos transaccionales porque es rápida, eficiente y fiable a escala, a la vez que ofrece integraciones sencillas con marcos de procesamiento de datos populares que se ejecutan en AWS, como Apache Spark, Apache Flink, Apache Hive, Presto, Trino, Dremio, etc., además de ser compatible con servicios de AWS como Amazon EMR, Amazon Redshift, Amazon Athena, AWS Glue y otros.
Apache Iceberg: La Guía Definitiva se centra en aplicaciones prácticas y escenarios útiles para los profesionales de los datos que utilizan Apache Iceberg, y cuenta con ejercicios ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access