Capítulo 5. Evaluación y mejora del modelo
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Tras haber tratado los fundamentos del aprendizaje supervisado y no supervisado, y haber explorado diversos algoritmos de aprendizaje automático, ahora nos sumergiremos más profundamente en la evaluación de modelos y la selección de parámetros.
Nos centraremos en los métodos supervisados, regresión y clasificación, ya que la evaluación y selección de modelos en el aprendizaje no supervisado suele ser un proceso muy cualitativo (como vimos en elCapítulo 3).
Para evaluar nuestros modelos supervisados, hasta ahora hemos dividido nuestro conjunto de datos en un conjunto de entrenamiento y un conjunto de prueba utilizando la función train_test_split
, hemos construido un modelo en el conjunto de entrenamiento llamando al método fit
, y lo hemos evaluado en el conjunto de prueba utilizando el método score
, que para la clasificación calcula la fracción de muestras clasificadas correctamente. He aquí un ejemplo de ese proceso:
In[1]:
from
sklearn.datasets
import
make_blobs
from
sklearn.linear_model
import
LogisticRegression
from
sklearn.model_selection
import
train_test_split
# create a synthetic dataset
X
,
y
=
make_blobs
(
random_state
=
0
)
# split data and labels into a training and a test set
X_train
,
X_test
,
y_train
,
y_test
=
train_test_split
(
X
,
y
,
random_state
=
0
)
# instantiate a model and fit it to the training set
logreg
=
Get Introducción al Aprendizaje Automático con Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.