Capítulo 5. Árboles de decisión
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Árboles de decisión son algoritmos versátiles de aprendizaje automático que pueden realizar tanto tareas de clasificación como de regresión, e incluso tareas de múltiples resultados. Son algoritmos potentes, capaces de ajustar conjuntos de datos complejos. Por ejemplo, en el Capítulo 2 entrenaste un modelo DecisionTreeRegressor en el conjunto de datos de viviendas de California, ajustándolo perfectamente (en realidad, sobreajustándolo).
Los árboles de decisión también son los componentes fundamentales de los bosques aleatorios (véase el Capítulo 6), que se encuentran entre los algoritmos de aprendizaje automático más potentes de la actualidad.
En este capítulo empezaremos por discutir cómo entrenar, visualizar y hacer predicciones con árboles de decisión. Después repasaremos el algoritmo de entrenamiento CART que utiliza Scikit-Learn, y exploraremos cómo regularizar los árboles y utilizarlos para tareas de regresión. Por último, discutiremos algunas de las limitaciones de los árboles de decisión.
Entrenamiento y visualización de un árbol de decisión
Para entender los árboles de decisión, construyamos uno y veamos cómo hace predicciones. El código siguiente entrena un DecisionTreeClassifier en el conjunto de datos del iris (véase el Capítulo 4):
fromsklearn.datasetsimportload_irisfromsklearn.treeimportDecisionTreeClassifier ...