Capítulo 12. Diseñar productos de datos utilizando el esquema JSON
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Todo está diseñado. Pocas cosas están bien diseñadas.
Brian Reed, renombrado diseñador industrial
El Capítulo 4 introdujo la idea de un producto de datos como un objeto autónomo con cuatro facetas: datos, estructura, significado y contexto. En la práctica, algunas de estas facetas tienden a ignorarse. Por ejemplo, los científicos de datos obtienen colecciones de CSV con filas incoherentes e información insuficiente sobre lo que significa cada columna, cuándo se creó el conjunto de datos, etc. La falta de estas facetas introduce ambigüedad, por lo que extraer información clave de estas fuentes de datos mal diseñadas se convierte en un gran reto, por muy caras que sean las herramientas o los conocimientos que se empleen en la tarea.
Para abordar este problema de datos, aprendiste una metodología probada para lograr la alineación en tu organización. También aprendiste las tecnologías fundamentales que hacen que esta metodología sea aplicable: JSON y JSON Schema. En este capítulo, pondremos todo ello en práctica guiándote por cómo diseñar un producto de datos con un enfoque de "primero el concepto" utilizando JSON y JSON Schema. Veremos cada faceta de un producto de datos en secuencia, basándonos en el registro de esquema JSON que implementaste en el Capítulo 11.
Primera faceta: Datos
La primera ...
Get Unificar la empresa, los datos y el código now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.