Capítulo 6. Árboles de decisión
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los árboles de decisión son algoritmos versátiles de aprendizaje automático que pueden realizar tanto tareas de clasificación como de regresión, e incluso tareas de múltiples resultados. Son algoritmos potentes, capaces de ajustarse a conjuntos de datos complejos. Por ejemplo, en el Capítulo 2 entrenaste un modelo DecisionTreeRegressor
en el conjunto de datos de viviendas de California, ajustándolo perfectamente (en realidad, sobreajustándolo).
Los árboles de decisión también son los componentes fundamentales de los bosques aleatorios (véase el Capítulo 7), que se encuentran entre los algoritmos de aprendizaje automático más potentes de la actualidad.
En este capítulo empezaremos hablando de cómo entrenar, visualizar y hacer predicciones con árboles de decisión. Luego repasaremos el algoritmo de entrenamiento CART que utiliza Scikit-Learn, y exploraremos cómo regularizar los árboles y utilizarlos para tareas de regresión. Por último, discutiremos algunas de las limitaciones de los árboles de decisión.
Entrenar y visualizar un árbol de decisión
Para entender los árboles de decisión, construyamos uno y veamos cómo hace predicciones. El código siguiente entrena un DecisionTreeClassifier
en el conjunto de datos del iris (véase el Capítulo 4):
from
sklearn.datasets
import
load_iris
from
sklearn.tree
import
DecisionTreeClassifier
iris ...
Get Aprendizaje automático práctico con Scikit-Learn, Keras y TensorFlow, 3ª edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.