Capítulo 9. Datos para las pruebas

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el capítulo anterior, viste cómo sustituir una de las dos dependencias en las pruebas de canalización de datos: las interfaces a servicios externos. Esto te lleva en parte a la prueba rentable. Este capítulo trata de cómo sustituir la segunda dependencia mencionada en el Capítulo 7: las fuentes de datos externas. En lugar de utilizar una fuente de datos real para las pruebas, verás cómo sustituirla por datos sintéticos.

En este capítulo hay un montón de técnicas ingeniosas para crear datos sintéticos, pero antes de poner en marcha tu IDE, es importante que evalúes si sustituir una dependencia de datos por datos sintéticos es lo correcto. Este capítulo comienza con una guía sobre cómo elegir entre datos reales y sintéticos para las pruebas, y las ventajas y dificultades de cada enfoque.

Después de esto, el resto del capítulo se centra en diferentes enfoques para la generación de datos sintéticos. El enfoque que trataré en primer lugar, la generación manual de datos, es el que probablemente hayas utilizado al crear unas cuantas filas de datos falsos para pruebas unitarias.

Lo aprendido en la creación manual de datos te ayudará a construir modelos precisos para la generación automatizada de datos, el enfoque que trataré a continuación. También verás cómo utilizar las bibliotecas de generación de datos para personalizar los generadores ...

Get Canalizaciones de datos rentables now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.