Chapitre 5. Arbres de décision
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Lesarbres de décision sont des algorithmes d'apprentissage automatique polyvalents qui peuvent effectuer à la fois des tâches de classification et de régression, et même des tâches à sorties multiples. Ce sont des algorithmes puissants, capables de s'adapter à des ensembles de données complexes. Par exemple, au chapitre 2, tu as formé un modèle DecisionTreeRegressor sur l'ensemble de données sur le logement en Californie, en l'adaptant parfaitement (en fait, en le surajoutant).
Les arbres de décision sont également les composants fondamentaux des forêts aléatoires (voir le chapitre 6), qui comptent parmi les algorithmes d'apprentissage automatique les plus puissants disponibles aujourd'hui.
Dans ce chapitre, nous commencerons par examiner comment former, visualiser et faire des prédictions avec les arbres de décision. Nous passerons ensuite en revue l'algorithme de formation CART utilisé par Scikit-Learn, et nous explorerons comment régulariser les arbres et les utiliser pour des tâches de régression. Enfin, nous discuterons de certaines des limites des arbres de décision.
Formation et visualisation d'un arbre de décision
Pour comprendre les arbres de décision, construisons-en un et voyons comment il fait des prédictions. Le code suivant entraîne un DecisionTreeClassifier sur l'ensemble de données de l'iris (voir le ...