Capítulo 29. Otros sistemas distribuidos de procesamiento de flujos en tiempo real

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Como hemos demostrado en a lo largo de este libro, el procesamiento de flujos es una tecnología crucial para toda empresa orientada a los datos. Existen muchas pilas de procesamiento de flujos que pueden ayudarnos en la tarea de procesar datos de flujos, tanto propietarias como de código abierto. Difieren en capacidades, API y ofrecen diferentes compensaciones en el equilibrio entre latencia y rendimiento.

Siguiendo el principio de la herramienta adecuada para el trabajo, deben compararse y contrastarse con los requisitos de cada nuevo proyecto para hacer la elección correcta.

Además, la evolución de la importancia de la nube más allá de ser un proveedor de infraestructura ha creado una nueva clase de ofertas, en las que la funcionalidad del sistema se ofrece como un servicio gestionado (Software como Servicio [SAAS]).

En este capítulo, vamos a hacer un breve repaso de los procesadores de streaming de código abierto más relevantes que se mantienen en la actualidad, como Apache Storm, Apache Flink, Apache Beam y Kafka Streams, y ofreceremos una visión general de la oferta de los proveedores de nube dominantes en el ámbito del streaming.

Tormenta Apache

Apache Storm es un proyecto de código abierto creado originalmente por Nathan Marz en BackType. Después se utilizó en Twitter y se ...

Get Procesamiento de flujos con Apache Spark now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.