Capítulo 1. Una rápida introducción a Kafka
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
La cantidad de datos en el mundo está creciendo exponencialmente y, según el Foro Económico Mundial, el número de bytes que se almacenan en el mundo ya supera con creces el número de estrellas del universo observable.
Cuando piensas en estos datos, puedes pensar en montones de bytes en almacenes de datos, en bases de datos relacionales o en sistemas de archivos distribuidos. Estos sistemas nos han enseñado a pensar en los datos en estado de reposo. En otras palabras, los datos están sentados en algún lugar, descansando, y cuando necesitas procesarlos, ejecutas alguna consulta o trabajo contra el montón de bytes.
Esta visión del mundo es la forma más tradicional de pensar sobre los datos. Sin embargo, aunque es cierto que los datos pueden acumularse en algunos lugares, lo más frecuente es que estén en movimiento. Verás, muchos sistemas generan flujos continuos de datos, incluidos sensores IoT, sensores médicos, sistemas financieros, software de análisis de usuarios y clientes, registros de aplicaciones y servidores, y mucho más. Incluso los datos que acaban encontrando un buen lugar para descansar, probablemente viajan por la red en algún momento antes de encontrar su hogar definitivo.
Si queremos procesar los datos en tiempo real, mientras se mueven, no podemos limitarnos a esperar a que se amontonen en algún lugar y luego ...