Capítulo 6. Pruebas automatizadas: Pruebas de modelos ML
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el capítulo anterior, vimos el precio que pagamos por no tener pruebas automatizadas en las soluciones de ML, y los beneficios que las pruebas aportan a los equipos en términos de calidad, flujo, carga cognitiva y satisfacción. Esbozamos los componentes básicos de una estrategia de pruebas completa y entramos en detalles sobre la primera categoría de pruebas: las pruebas de software.
En este capítulo exploraremos la siguiente categoría de pruebas: Las pruebas de modelos ML (o pruebas de modelos, para abreviar). Dado que los grandes modelos lingüísticos (LLM) han tomado el mundo por asalto, también cubriremos técnicas para probar LLM y aplicaciones LLM.
Además, exploraremos prácticas que complementan las pruebas de modelos ML, como la visualización y el análisis de errores, el cierre del bucle de recopilación de datos y el diseño de pruebas abierto-cerrado. También hablaremos brevemente de las pruebas de datos antes de concluir con los próximos pasos concretos que pueden ayudarte a implantar estas pruebas en tus sistemas de ML.
En este capítulo, nos centraremos en las pruebas fuera de línea a escala, y no cubriremos las técnicas de pruebas en línea (p. ej., pruebas A/B, bandidos, experimentos intercalados), ya que están bien tratadas en el estupendo libro de Chip Huyen Designing Machine Learning Systems ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access