Capítulo 2. El qué, dónde, cuándo y cómo del tratamiento de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Vale, fiesteros, ¡es hora de concretar!

El Capítulo 1 se centró en tres áreas principales: terminología, definiendo con precisión a qué me refiero cuando utilizo términos sobrecargados como "streaming"; batch frente a streaming, comparando las capacidades teóricas de los dos tipos de sistemas, y postulando que sólo son necesarias dos cosas para llevar a los sistemas de streaming más allá de sus homólogos batch: corrección y herramientas para razonar sobre el tiempo; y patrones de procesamiento de datos, examinando los enfoques conceptuales adoptados tanto con los sistemas batch como con los de streaming al procesar datos acotados y no acotados.

En este capítulo, vamos a centrarnos más en los patrones de procesamiento de datos del Capítulo 1, pero con más detalle y en el contexto de ejemplos concretos. Cuando hayamos terminado, habremos cubierto lo que considero el conjunto básico de principios y conceptos necesarios para un sólido procesamiento de datos fuera de orden; éstas son las herramientas para razonar sobre el tiempo que realmente te llevan más allá del clásico procesamiento por lotes.

Para que te hagas una idea de cómo son las cosas en acción, utilizo fragmentos de código de Apache Beam, junto con diagramas de lapso de tiempo1 para ofrecer una representación visual de los conceptos. Apache ...

Get Sistemas de streaming now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.