Capítulo 9. Apache Flink
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Apache Flink es un marco eficiente de procesamiento de flujos que puede procesar datos por lotes y en tiempo real con alto rendimiento y baja latencia. Tiene características robustas, como el procesamiento en tiempo de eventos, la semántica exactamente una vez y diversos mecanismos de ventanas. La combinación de Apache Flink y Apache Iceberg aporta varias ventajas. Las capacidades de Iceberg, como el aislamiento de instantáneas para lecturas y escrituras, la capacidad de gestionar múltiples operaciones simultáneas, las consultas compatibles con ACID y las lecturas incrementales, permiten a Flink realizar operaciones que normalmente eran difíciles con formatos de tabla más antiguos. Juntos proporcionan una plataforma eficiente y escalable para procesar datos a gran escala, específicamente para casos de uso de streaming.
En este capítulo, nos adentraremos en el uso práctico de Apache Flink con Apache Iceberg. Nos ocuparemos principalmente de configurar e instalar el Cliente SQL de Flink con un catálogo Iceberg para la mayoría de los ejemplos, como ejecutar comandos DDL, ejecutar consultas de lectura y escritura, y mostrar cómo realizar algunas de estas operaciones utilizando las API de Flink DataStream y Table en Java. Todo ello puede ejecutarse en tu máquina local con los pasos proporcionados.
Configuración
Empecemos repasando la configuración ...
Get Apache Iceberg: La Guía Definitiva now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.