Capítulo 15. Métricas y evaluación de la regresión

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Este capítulo evaluará los resultados de un regresor de bosque aleatorio entrenado con los datos de vivienda de Boston:

>>> rfr = RandomForestRegressor(
...     random_state=42, n_estimators=100
... )
>>> rfr.fit(bos_X_train, bos_y_train)

Métricas

El módulo sklearn.metrics incluye métricas para evaluar modelos de regresión. Las funciones métricas que terminan en loss o error deben minimizarse. Las funciones que terminan en score deben maximizarse.

El coeficiente de determinación (r²) es una métrica de regresión habitual. Este valor suele estar entre 0 y 1. Representa el porcentaje de la varianza del objetivo al que contribuyen las características. Los valores más altos son mejores, pero en general es difícil evaluar el modelo sólo a partir de esta métrica. ¿Un 0,7 significa que es una buena puntuación? Depende. Para un conjunto de datos determinado, 0,5 puede ser una buena puntuación, mientras que para otro conjunto de datos, 0,9 puede ser una mala puntuación. Normalmente utilizamos este número en combinación con otras métricas o visualizaciones para evaluar un modelo.

Por ejemplo, es fácil hacer un modelo que prediga los precios de las acciones para el día siguiente con un r² de 0,99. Pero yo negociaría mi propio dinero con ese modelo. Pero yo no negociaría mi propio dinero con ese modelo. Podría ser ligeramente ...

Get Referencia de bolsillo sobre aprendizaje automático now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.