Capítulo 23. El streaming estructurado en la producción
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los capítulos anteriores de esta parte del libro han cubierto el Streaming Estructurado desde la perspectiva del usuario. Naturalmente, éste es el núcleo de tu aplicación. Este capítulo cubre algunas de las herramientas operativas necesarias para ejecutar Structured Streaming de forma sólida en producción después de haber desarrollado una aplicación.
Structured Streaming fue marcado como listo para producción en Apache Spark 2.2.0, lo que significa que esta versión tiene todas las características necesarias para su uso en producción y estabiliza la API. Muchas organizaciones ya están utilizando el sistema en producción porque, francamente, no es muy diferente de ejecutar otras aplicaciones Spark de producción. De hecho, mediante características como las fuentes/sumideros transaccionales y el procesamiento exactamente una vez, los diseñadores de Structured Streaming trataron de hacerlo lo más fácil de manejar posible. Este capítulo te guiará a través de algunas de las tareas operativas clave específicas del Streaming Estructurado. Esto debería complementar todo lo que vimos y aprendimos sobre las operaciones de Spark en la Parte II.
Tolerancia a fallos y puntos de control
La preocupación operativa más importante para una aplicación de streaming es la recuperación ante fallos. Los fallos son inevitables: perderás ...
Get Spark: La Guía Definitiva now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.