Capítulo 14. Regresión

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Regresión es un proceso de aprendizaje automático supervisado. Es similar a la clasificación, pero en lugar de predecir una etiqueta, intentamos predecir un valor continuo. Si intentas predecir un número, utiliza la regresión.

Resulta que sklearn admite muchos de los mismos modelos de clasificación para problemas de regresión. De hecho, la API es la misma, llamando a .fit, .score, y .predict. Lo mismo ocurre con las bibliotecas de boosting de nueva generación, XGBoost y LightGBM.

Aunque existen similitudes con los modelos de clasificación y los hiperparámetros, las métricas de evaluación son diferentes para la regresión. En este capítulo repasaremos muchos de los tipos de modelos de regresión. Utilizaremos el conjunto de datos de viviendas de Boston para explorarlos.

Aquí cargamos los datos, creamos una versión dividida para entrenamiento y prueba, y creamos otra versión dividida con datos normalizados:

>>> import pandas as pd
>>> from sklearn.datasets import load_boston
>>> from sklearn import (
...     model_selection,
...     preprocessing,
... )
>>> b = load_boston()
>>> bos_X = pd.DataFrame(
...     b.data, columns=b.feature_names
... )
>>> bos_y = b.target

>>> bos_X_train, bos_X_test, bos_y_train, bos_y_test = model_selection.train_test_split(
...     bos_X,
...     bos_y,
...     test_size=0.3,
...     random_state=42,
... )


>>> bos_sX = preprocessing

Get Referencia de bolsillo sobre aprendizaje automático now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.