Capítulo 13. Pruebas de sistemas de IA
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
MLOps es un conjunto de buenas prácticas para la prueba, el control de versiones y el monitoreo automatizados de los procesos y activos de ML que impulsan nuestros sistemas de IA. Hemos presentado MLOps en el capítulo 1, las pruebas de validación de datos en el capítulo 6 y las pruebas unitarias para funciones de transformación en el capítulo 7. Pero aún queda mucho por cubrir. Si quieres crear un sistema de IA fiable, controlado y fácil de mantener, necesitas pruebas de integración para cada uno de tus procesos de ML, que se ejecuten tanto durante el desarrollo como antes de la implementación. Veremos cómo escribir pruebas de procesos de funciones y pruebas de validación de modelos, y cómo probar las implementaciones de modelos. Veremos cómo empaquetar de forma fiable nuestros procesos de ML con contenedorización automática en entornos de desarrollo, staging y producción. También presentaremos pruebas offline de agentes y flujos de trabajo LLM con evaluaciones.
Las pruebas son fundamentales para crear un sistema de IA de alta calidad. Tus pruebas deben estar a un nivel tal que te sientas tan seguro de ellas que puedas implementarlas en producción un viernes. E incluso si una actualización falla, podrás revertir fácilmente los cambios. En el próximo capítulo nos centraremos en las cuestiones operativas de MLOps, pero en este ...