Capítulo 12. Métricas y evaluación de la clasificación

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo trataremos las siguientes métricas y herramientas de evaluación: matrices de confusión, varias métricas, un informe de clasificación y algunas visualizaciones.

Esto se evaluará como un modelo de árbol de decisión que predice la supervivencia en el Titanic.

Matriz de confusión

Una matriz de confusión puede ayudar a comprender el rendimiento de un clasificador.

Un clasificador binario puede tener cuatro resultados de clasificación: verdaderos positivos (TP), verdaderos negativos (TN), falsos positivos (FP) y falsos negativos (FN). Los dos primeros son clasificaciones correctas.

He aquí un ejemplo habitual para recordar los demás resultados. Suponiendo que positivo significa embarazada y negativo no embarazada, un falso positivo es como afirmar que un hombre está embarazado. Un falso negativo es afirmar que una mujer embarazada no lo está (cuando es evidente que lo está) (véase la Figura 12-1). Estos dos últimos tipos de errores se denominan errores de tipo 1 y de tipo 2, respectivamente (consulta la Tabla 12-1).

Otra forma de recordarlos es que P (para falsos positivos) tiene una línea recta (error de tipo 1), y N (para falsos negativos) tiene dos líneas verticales.

Classification errors.
Figura 12-1. Errores de clasificación. ...

Get Referencia de bolsillo sobre aprendizaje automático now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.