Capítulo 11. Streaming con Apache Iceberg
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Elstreaming de datos se refiere a la generación y procesamiento continuos de datos en, a menudo procedentes de diversas fuentes. Estas fuentes pueden incluir archivos de registro, datos de sensores, fuentes de medios sociales y transacciones financieras, entre otras. Los datos se envían en pequeños tamaños (o paquetes) para permitir percepciones y reacciones en tiempo real. La naturaleza de los datos en flujo es que están en constante movimiento y no tienen un principio ni un final finitos.
El concepto de streaming de datos es esencial en la era actual de la información digital, en la que las empresas, las instituciones de investigación y las agencias gubernamentales a menudo necesitan analizar y tomar decisiones basándose en los datos más recientes posibles. Por ejemplo, las instituciones financieras pueden utilizar el streaming de datos para detectar transacciones fraudulentas en el momento en que se producen. Del mismo modo, las plataformas de medios sociales utilizan los datos de streaming para personalizar y actualizar los feeds de los usuarios en función de las métricas de participación en tiempo real.
Hay varias razones por las que uno puede querer transmitir datos a una tabla Iceberg de Apache:
- Escalabilidad y rendimiento
Apache Iceberg está diseñado para almacenar y recuperar información de forma eficiente a partir ...
Get Apache Iceberg: La Guía Definitiva now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.