Capitolo 14. Elaborazione dei flussi
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Kafka è stato tradizionalmente visto come un potente bus di messaggi, in grado di fornire flussi di eventi ma senza capacità di elaborazione o trasformazione. L'affidabilità di Kafka nel fornire flussi di eventi lo rende una fonte di dati perfetta per i sistemi di elaborazione dei flussi. Apache Storm, Apache Spark Streaming, Apache Flink, Apache Samza e molti altri sistemi di elaborazione dei flussi sono stati creati con Kafka come unica fonte di dati affidabile.
Con l'aumento della popolarità di Apache Kafka, prima come semplice bus di messaggi e poi come sistema di integrazione dei dati, molte aziende avevano un sistema contenente molti flussi di dati interessanti, conservati per lunghi periodi di tempo e perfettamente ordinati, che aspettavano solo l'arrivo di un framework di elaborazione dei flussi per elaborarli. In altre parole, allo stesso modo in cui l'elaborazione dei dati era molto più difficile prima dell'invenzione dei database, l'elaborazione dei flussi era frenata dalla mancanza di una piattaforma di elaborazione dei flussi.
A partire dalla versione 0.10.0, Kafka non si limita a fornire una fonte affidabile di flussi di dati a tutti i più diffusi framework di elaborazione dei flussi. Ora Kafka include una potente libreria per l'elaborazione dei flussi come parte della sua collezione di librerie ...