Prefácio
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Para engenheiros de dados e cientistas de dados, nunca faltam tecnologias que competem pela nossa atenção. Quer estejamos a ler os nossos subreddits favoritos, a analisar o Hacker News, a ler blogues de tecnologia ou a percorrer centenas de mesas numa conferênciade tecnologia, há tantas coisas para ver que pode começar a pareceresmagador.
Mas se conseguirmos encontrar um canto sossegado para pensar por um minuto e deixar que todo o burburinho se desvaneça, podemos começar a distinguir padrões do ruído. Sabes, vivemos na era do crescimento explosivo de dados e muitas destas tecnologias foram criadas para nos ajudar a armazenar e processar dados em escala. Dizem-nos que se trata de soluções modernas para problemas modernos, e ficamos a discutir o "big data" como se a ideia fosse vanguardista, quando, na verdade, o foco no volume de dados é apenas metade da história.
As tecnologias que apenas resolvem o problema do volume de dados tendem a utilizar técnicas de processamento de dados orientadas para o lote. Isto implica a execução de uma tarefa num conjunto de dados acumulados durante um determinado período de tempo. De certa forma, isto é como tentar beber o oceano todo de uma vez. Com o poder e os paradigmas da computação moderna, algumas tecnologias conseguem atingir este objetivo, embora normalmente à custa de uma elevada latência.
Em vez disso, há outra ...