Capítulo 11. Análise de fluxo contínuo e aprendizagem automática
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Em os capítulos anteriores, assumimos que temos todos os nossos dados disponíveis em um local estático centralizado, como nosso lago de dados baseado em S3. Os dados do mundo real são transmitidos continuamente de muitas fontes diferentes em todo o mundo simultaneamente. Precisamos executar o aprendizado de máquina em fluxos de dados para casos de uso, como prevenção de fraudes e deteção de anomalias, em que a latência do processamento em lote não é aceitável. Também podemos querer executar análises contínuas em fluxos de dados em tempo real para obter vantagens competitivas e reduzir o tempo de obtenção de informações comerciais.
Neste capítulo, passamos do nosso conjunto de dados de treino de avaliações de clientes para um cenário do mundo real. Vamos concentrar-nos na análise de um fluxo contínuo de mensagens de avaliação de produtos que recolhemos de todos os canais online disponíveis. O feedback do cliente sobre o produto aparece em todo o lado, incluindo canais de redes sociais, sítios Web de parceiros e sistemas de apoio ao cliente. Precisamos de captar este valioso sentimento do cliente sobre os nossos produtos o mais rapidamente possível para detetar tendências e reagir rapidamente.
Com a análise de fluxo e a aprendizagem automática do, podemos analisar fluxos de dados contínuos, como registos ...