Capítulo 8. Pegamento AWS

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

AWS Glue es un servicio de integración de datos totalmente administrado que proporciona una forma racionalizada de preparar e integrar datos para diversas cargas de trabajo analíticas, como la inteligencia empresarial (BI) y el aprendizaje automático (ML). También ofrece una interfaz visual fácil de usar que simplifica el proceso de creación, ejecución y gestión de trabajos. Al aprovechar AWS Glue, los usuarios pueden utilizar el catálogo de datos escalable y sin servidor para administrar sus flujos de trabajo. AWS Glue 3.0 y versiones posteriores admiten el formato de tabla Apache Iceberg. Esto significa que puedes utilizar Glue con Iceberg para una serie de operaciones, como crear tablas Iceberg en almacenes de objetos como Amazon Simple Storage Service (Amazon S3), realizar operaciones de lectura y escritura, o simplemente aprovechar el catálogo Glue para almacenar todas tus tablas Iceberg.

En este capítulo, aprenderás a configurar AWS Glue con tablas Apache Iceberg y a realizar diversas operaciones como CREATE, READ y INSERT.

En el momento de escribir esto, AWS Glue 4.0 es compatible con Iceberg v1.0.0, mientras que AWS Glue 3.0 es compatible con Iceberg v0.13.1.

Configuración

La herramienta de integración AWS Glue funciona en base a "trabajos" que representan una única unidad de trabajo, moviendo datos desde un origen (cualquier lugar) ...

Get Apache Iceberg: La Guía Definitiva now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.