Capítulo 5. Evaluación y mejora del modelo
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Tras haber tratado los fundamentos del aprendizaje supervisado y no supervisado, y haber explorado diversos algoritmos de aprendizaje automático, ahora nos sumergiremos más profundamente en la evaluación de modelos y la selección de parámetros.
Nos centraremos en los métodos supervisados, regresión y clasificación, ya que la evaluación y selección de modelos en el aprendizaje no supervisado suele ser un proceso muy cualitativo (como vimos en elCapítulo 3).
Para evaluar nuestros modelos supervisados, hasta ahora hemos dividido nuestro conjunto de datos en un conjunto de entrenamiento y un conjunto de prueba utilizando la función train_test_split, hemos construido un modelo en el conjunto de entrenamiento llamando al método fit, y lo hemos evaluado en el conjunto de prueba utilizando el método score, que para la clasificación calcula la fracción de muestras clasificadas correctamente. He aquí un ejemplo de ese proceso:
In[1]:
fromsklearn.datasetsimportmake_blobsfromsklearn.linear_modelimportLogisticRegressionfromsklearn.model_selectionimporttrain_test_split# create a synthetic datasetX,y=make_blobs(random_state=0)# split data and labels into a training and a test setX_train,X_test,y_train,y_test=train_test_split(X,y,random_state=0)# instantiate a model and fit it to the training setlogreg=