Capítulo 6. Árboles de decisión

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Los árboles de decisión son algoritmos versátiles de aprendizaje automático que pueden realizar tanto tareas de clasificación como de regresión, e incluso tareas de múltiples resultados. Son algoritmos potentes, capaces de ajustarse a conjuntos de datos complejos. Por ejemplo, en el Capítulo 2 entrenaste un modelo DecisionTreeRegressor en el conjunto de datos de viviendas de California, ajustándolo perfectamente (en realidad, sobreajustándolo).

Los árboles de decisión también son los componentes fundamentales de los bosques aleatorios (véase el Capítulo 7), que se encuentran entre los algoritmos de aprendizaje automático más potentes de la actualidad.

En este capítulo empezaremos hablando de cómo entrenar, visualizar y hacer predicciones con árboles de decisión. Luego repasaremos el algoritmo de entrenamiento CART que utiliza Scikit-Learn, y exploraremos cómo regularizar los árboles y utilizarlos para tareas de regresión. Por último, discutiremos algunas de las limitaciones de los árboles de decisión.

Entrenar y visualizar un árbol de decisión

Para entender los árboles de decisión, construyamos uno y veamos cómo hace predicciones. El código siguiente entrena un DecisionTreeClassifier en el conjunto de datos del iris (véase el Capítulo 4):

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier

iris ...

Get Aprendizaje automático práctico con Scikit-Learn, Keras y TensorFlow, 3ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.