Capítulo 14. Regresión
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Regresión es un proceso de aprendizaje automático supervisado. Es similar a la clasificación, pero en lugar de predecir una etiqueta, intentamos predecir un valor continuo. Si intentas predecir un número, utiliza la regresión.
Resulta que sklearn admite muchos de los mismos modelos de clasificación para problemas de regresión. De hecho, la API es la misma, llamando a .fit
, .score
, y .predict
. Lo mismo ocurre con las bibliotecas de boosting de nueva generación, XGBoost y LightGBM.
Aunque existen similitudes con los modelos de clasificación y los hiperparámetros, las métricas de evaluación son diferentes para la regresión. En este capítulo repasaremos muchos de los tipos de modelos de regresión. Utilizaremos el conjunto de datos de viviendas de Boston para explorarlos.
Aquí cargamos los datos, creamos una versión dividida para entrenamiento y prueba, y creamos otra versión dividida con datos normalizados:
>>>
import
pandas
as
pd
>>>
from
sklearn.datasets
import
load_boston
>>>
from
sklearn
import
(
...
model_selection
,
...
preprocessing
,
...
)
>>>
b
=
load_boston
()
>>>
bos_X
=
pd
.
DataFrame
(
...
b
.
data
,
columns
=
b
.
feature_names
...
)
>>>
bos_y
=
b
.
target
>>>
bos_X_train
,
bos_X_test
,
bos_y_train
,
bos_y_test
=
model_selection
.
train_test_split
(
...
bos_X
,
...
bos_y
,
...
test_size
=
0.3
,
...
random_state
=
42
,
...
)
>>>
bos_sX
=
preprocessing
Get Referencia de bolsillo sobre aprendizaje automático now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.