Parte II. Construir una tubería de trabajo
Dado que investigar, entrenar y evaluar modelos es un proceso que lleva mucho tiempo, ir en la dirección equivocada puede resultar muy costoso en ML. Por eso este libro se centra en reducir el riesgo e identificar la máxima prioridad en la que trabajar.
Mientras que la Parte I se centró en la planificación para maximizar nuestra velocidad y nuestras posibilidades de éxito, este capítulo se sumergirá en la implementación. Como muestra la Figura II-1, en ML, como en gran parte de la ingeniería de software, debes llegar a un producto mínimo viable (MVP) lo antes posible. Esta sección tratará precisamente de eso: de la forma más rápida de poner en marcha una canalización y evaluarla.
Mejorar dicho modelo será el tema central de la Parte III de este libro.
Figura II-1. La forma correcta de construir tu primer pipeline (reproducido con permiso de Henrik Kniberg)
Construiremos nuestro modelo inicial en dos pasos:
- Capítulo 3
-
En este capítulo, construiremos la estructura y el andamiaje de nuestra aplicación. Esto implicará la construcción de un canal para recibir las entradas del usuario y devolver sugerencias, y otro canal para entrenar nuestros modelos antes de utilizarlos.
- Capítulo 4
-
En este capítulo, nos centraremos en recopilar e inspeccionar un conjunto de datos inicial. El objetivo aquí es identificar rápidamente patrones en nuestros ...