Overview
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Empieza a utilizar Apache Flink, el framework de código abierto que impulsa algunas de las aplicaciones de procesamiento de flujos más grandes del mundo. Con este práctico libro, explorarás los conceptos fundamentales del procesamiento paralelo de flujos y descubrirás en qué se diferencia esta tecnología del procesamiento tradicional de datos por lotes.
Fabian Hueske y Vasia Kalavri, committers de Apache Flink desde hace mucho tiempo, te muestran cómo implementar aplicaciones de flujo escalables con la API DataStream de Flink y cómo ejecutar y mantener continuamente estas aplicaciones en entornos operativos. El procesamiento en flujo es ideal para muchos casos de uso, como ETL de baja latencia, análisis en flujo y cuadros de mando en tiempo real, así como detección de fraudes, detección de anomalías y alertas. Puedes procesar datos continuos de cualquier tipo, incluidas interacciones de usuarios, transacciones financieras y datos IoT, en cuanto los generes.
- Aprende conceptos y retos del procesamiento distribuido de flujos con estado
- Explora la arquitectura del sistema Flink, incluyendo su modo de procesamiento en tiempo de eventos y su modelo de tolerancia a fallos
- Comprender los fundamentos y los bloques de construcción de la API DataStream, incluidos sus operadores basados en el tiempo y en el estado
- Lee datos de sistemas externos y escribe datos en ellos con coherencia exactamente una vez
- Despliega y configura clusters Flink
- Operar aplicaciones de streaming en ejecución continua
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access