Capítulo 1. Uma rápida introdução ao Kafka
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
A quantidade de dados no mundo está a crescer exponencialmente e, de acordo com o Fórum Económico Mundial, o número de bytes armazenados no mundo já excede largamente o número de estrelas no universo observável.
Quando pensas nestes dados, podes pensar em pilhas de bytes em armazéns de dados, em bases de dados relacionais ou em sistemas de ficheiros distribuídos. Sistemas como estes treinaram-nos a pensar nos dados no seu estado de repouso. Por outras palavras, os dados estão algures, em repouso, e quando é necessário processá-los, executa-se uma consulta ou um trabalho sobre a pilha de bytes.
Esta visão do mundo é a forma mais tradicional de pensar sobre os dados. No entanto, embora os dados possam certamente acumular-se em alguns locais, na maioria das vezes, estão em movimento. Como vês, muitos sistemas geram fluxos contínuos de dados, incluindo sensores IoT, sensores médicos, sistemas financeiros, software de análise de utilizadores e clientes, registos de aplicações e servidores, entre outros. Mesmo os dados que eventualmente encontram um bom lugar para descansar provavelmente viajam pela rede em algum momento antes de encontrar seu lar definitivo.
Se quisermos processar dados em tempo real, enquanto eles se movem, não podemos simplesmente esperar que eles se acumulem em algum lugar e depois executar uma consulta ...