Chapitre 3. La classification
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Dans Chapitre 1, j'ai mentionné que les tâches d'apprentissage supervisé les plus courantes sont la régression (prédire des valeurs) et la classification (prédire des classes). Au chapitre 2, nous avons exploré une tâche de régression, la prédiction des valeurs des logements, à l'aide de divers algorithmes tels que la régression linéaire, les arbres de décision et les forêts aléatoires (qui seront expliqués plus en détail dans les chapitres suivants). Nous allons maintenant nous intéresser aux systèmes de classification.
MNIST
Sur le site, nous utiliserons l'ensemble de données MNIST, qui comprend 70 000 petites images de chiffres écrits à la main par des lycéens et des employés du Bureau de recensement des États-Unis. Chaque image est étiquetée avec le chiffre qu'elle représente. Cet ensemble a été tellement étudié qu'il est souvent appelé le "hello world" de l'apprentissage automatique : chaque fois que des personnes proposent un nouvel algorithme de classification, elles sont curieuses de voir comment il se comportera sur MNIST, et toute personne qui apprend l'apprentissage automatique s'attaque tôt ou tard à cet ensemble de données.
Scikit-Learn fournit de nombreuses fonctions d'aide pour télécharger des ensembles de données populaires. MNIST est l'un d'entre eux. Le code suivant récupère l'ensemble de données MNIST ...