Capítulo 4. Evaluación de la utilidad de los datos sintéticos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Para lograr un uso y una adopción generalizados, los datos sintéticos deben tener la utilidad suficiente para producir resultados de análisis similares a los de los datos originales.1 Éste es el ejercicio de creación de confianza que se trató en el Capítulo 1. Si sabemos con precisión cómo se van a utilizar los datos sintéticos, podemos sintetizarlos para que tengan una gran utilidad para ese fin; por ejemplo, si se conoce el tipo específico de análisis estadístico o modelo de regresión que se realizará con los datos sintéticos. Sin embargo, en la práctica, los sintetizadores no suelen conocer a priori todos los análisis que se realizarán con los datos sintéticos. Los datos sintéticos deben tener una gran utilidad para una amplia gama de usos posibles.
En este capítulo se esboza un marco de utilidad de datos que puede utilizarse para los datos sintéticos. Un marco común de utilidad de datos sería beneficioso porque permitiría lo siguiente:
-
Que los sintetizadores de datos optimicen sus métodos de generación para conseguir una granutilidad de los datos
-
Diferentes enfoques de síntesis de datos para que los usuarios puedan compararlos de forma coherente al elegir entre métodos de síntesis de datos
-
Que los usuarios de los datos comprendan rápidamente la fiabilidad de los resultados de los datos sintéticos ...