Capítulo 5. Servicio de Movimiento de Datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el viaje de desarrollo de percepciones para resolver problemas empresariales, hemos hablado de descubrir conjuntos de datos existentes y sus metadatos, y de artefactos y características reutilizables que pueden usarse para desarrollar las percepciones. A menudo, los atributos de datos procedentes de distintos almacenes de datos o bases de datos de aplicaciones deben agregarse para elaborar perspectivas. Por ejemplo, el panel de ingresos requerirá que los atributos de facturación, códigos de producto y ofertas especiales se trasladen a un almacén de datos común que luego se consulte y se una para actualizar el panel cada pocas horas o en tiempo real. Los usuarios de datos dedican el 16% de su tiempo a mover datos. En la actualidad, el movimiento de datos provoca puntos de dolor para orquestar el movimiento de datos a través de fuentes de datos heterogéneas, verificar la corrección de los datos entre la fuente y el destino de forma continua, y adaptarse a cualquier cambio de esquema o configuración que se produzca habitualmente en la fuente de datos.

Garantizar que los atributos de datos de las distintas fuentes estén disponibles a tiempo es uno de los principales puntos débiles. El tiempo que se invierte en hacer que los datos estén disponibles afecta a la productividad y ralentiza el tiempo total de obtención de información. ...

Get La hoja de ruta de los datos de autoservicio now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.