Capítulo 5. Evaluación y mejora del modelo

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Tras haber tratado los fundamentos del aprendizaje supervisado y no supervisado, y haber explorado diversos algoritmos de aprendizaje automático, ahora nos sumergiremos más profundamente en la evaluación de modelos y la selección de parámetros.

Nos centraremos en los métodos supervisados, regresión y clasificación, ya que la evaluación y selección de modelos en el aprendizaje no supervisado suele ser un proceso muy cualitativo (como vimos en elCapítulo 3).

Para evaluar nuestros modelos supervisados, hasta ahora hemos dividido nuestro conjunto de datos en un conjunto de entrenamiento y un conjunto de prueba utilizando la función train_test_split, hemos construido un modelo en el conjunto de entrenamiento llamando al método fit, y lo hemos evaluado en el conjunto de prueba utilizando el método score, que para la clasificación calcula la fracción de muestras clasificadas correctamente. He aquí un ejemplo de ese proceso:

In[1]:

from sklearn.datasets import make_blobs
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

# create a synthetic dataset
X, y = make_blobs(random_state=0)
# split data and labels into a training and a test set
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)
# instantiate a model and fit it to the training set
logreg = 

Get Introducción al Aprendizaje Automático con Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.