Capítulo 2. Servicio de Catálogo de Metadatos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Supongamos que un usuario de datos quiere desarrollar un panel de ingresos. Hablando con otros analistas y científicos de datos, el usuario encuentra un conjunto de datos con detalles relacionados con los registros de facturación de los clientes. Dentro de ese conjunto de datos, se encuentran con un atributo llamado "tasa de facturación". ¿Cuál es el significado del atributo? ¿Es la fuente de la verdad, o se deriva de otro conjunto de datos? Surgen otras preguntas, como ¿cuál es el esquema de los datos? ¿Quién los gestiona? ¿Cómo se han transformado? ¿Cuál es la calidad de los datos? ¿Cuándo se actualizaron? y así sucesivamente. No hay escasez de datos en la empresa, pero consumir los datos para resolver problemas empresariales es un reto importante hoy en día. Esto se debe a que la creación de perspectivas en forma de cuadros de mando y modelos ML requiere una comprensión clara de las propiedades de los datos (lo que se conoce como metadatos). En ausencia de metadatos completos, se pueden hacer suposiciones inexactas sobre el significado de los datos y sobre su calidad, lo que conduce a percepciones incorrectas.

Conseguir metadatos fiables es un punto delicado para los usuarios de datos. Antes de la era de los big data, los datos se conservaban antes de añadirlos al almacén central: los detalles de los metadatos, como ...

Get La hoja de ruta de los datos de autoservicio now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.