Capítulo 1. Introducción a las canalizaciones de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Detrás de cada panel de control brillante, modelo de aprendizaje automático y conocimiento que cambia el negocio, hay datos. No sólo datos en bruto, sino datos recogidos de numerosas fuentes que deben limpiarse, procesarse y combinarse para aportar valor. La famosa frase "los datos son el nuevo petróleo" ha demostrado ser cierta. Al igual que el petróleo, el valor de los datos reside en su potencial una vez refinados y entregados al consumidor. También como el petróleo, se necesitan conductos eficientes para entregar los datos a través de cada etapa de su cadena de valor.
Esta Referencia de Bolsillo analiza qué son estas canalizaciones de datos y muestra cómo encajan en un ecosistema de datos moderno. Abarca consideraciones comunes y puntos de decisión clave a la hora de implantar canalizaciones, como la ingesta de datos por lotes frente a la de flujo, la creación frente a la compra de herramientas, etc. Aunque no es exclusivo de un único lenguaje o plataforma, aborda las decisiones más comunes que toman los profesionales de los datos, a la vez que discute los conceptos fundamentales que se aplican a las soluciones de cosecha propia, a los marcos de trabajo de código abierto y a los productos comerciales.
¿Qué son las canalizaciones de datos?
Las canalizaciones de datos son conjuntos de procesos que mueven ...