Statistiques pratiques pour les scientifiques des données, 2e édition.
by Peter Bruce, Andrew Bruce, Peter Gedeck
Chapitre 6. Apprentissage statistique des machines
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Les progrès récents de la statistique ont été consacrés au développement de techniques automatisées plus puissantes pour la modélisation prédictive - à la fois la régression et la classification.Ces méthodes, comme celles discutées dans le chapitre précédent, sont des méthodes supervisées - ellessont formées sur des données dont les résultats sont connus et apprennent à prédire les résultats dans de nouvelles données. Elles relèvent de l'apprentissage automatique statistique et se distinguent des méthodes statistiques classiques par le fait qu'elles sont axées sur les données et ne cherchent pas à imposer une structure linéaire ou globale aux données.La méthode des K-voisins les plus proches, par exemple, est assez simple : classer un enregistrement en fonction de la façon dont les enregistrements similaires sont classés.Les techniques les plus réussies et les plus largement utilisées sont basées sur l'apprentissage d'ensemble appliqué aux arbres de décision. L'idée de base de l'apprentissage d'ensemble est d'utiliser de nombreux modèles pour former une prédiction, par opposition à l'utilisation d'un seul modèle. Les arbres de décision sont une technique flexible et automatique pour apprendre des règles sur les relations entre les variables prédictives et les variables de résultat. Il s'avère que la ...