Capítulo 1. Introducción a Apache Iceberg
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los datos son un activo primario del que las organizaciones extraen la información y los conocimientos necesarios para tomar decisiones empresariales críticas. Tanto si se utilizan para analizar las tendencias de las ventas anuales de un determinado producto como para predecir futuras oportunidades de mercado, los datos marcan la dirección que deben seguir las organizaciones para tener éxito. Además, hoy en día los datos no son sólo algo que se puede tener. Es un requisito, no sólo para ganar en el mercado, sino para competir en él. Con una demanda tan masiva de información, se ha hecho un enorme esfuerzo por acumular los datos generados por los diversos sistemas de una organización para obtener información.
Al mismo tiempo, el ritmo al que los sistemas operativos y analíticos han ido generando datos se ha disparado. Aunque más datos han brindado a las empresas la oportunidad de tomar decisiones mejor informadas, también hay una necesidad imperiosa de disponer de una plataforma que almacene y analice todos estos datos, de modo que puedan utilizarse para crear productos analíticos, como informes de inteligencia empresarial (BI) y modelos de aprendizaje automático (ML), para apoyar la toma de decisiones. La arquitectura Lakehouse, que desarrollaremos en este capítulo, desvincula cómo almacenamos nuestros datos de cómo los ...