Capitolo 3. Classificazione
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Nel Capitolo 1 di ho detto che i compiti di apprendimento supervisionato più comuni sono la regressione (previsione di valori) e la classificazione (previsione di classi). Nel Capitolo 2 abbiamo esplorato un compito di regressione, la previsione dei valori delle abitazioni, utilizzando vari algoritmi come la regressione lineare, gli alberi decisionali e le foreste casuali (che verranno spiegati in dettaglio nei capitoli successivi). Ora ci dedicheremo ai sistemi di classificazione.
MNIST
In questo capitolo utilizzeremo il dataset MNIST, che è un insieme di 70.000 piccole immagini di cifre scritte a mano da studenti delle scuole superiori e da impiegati dell'Ufficio del Censimento degli Stati Uniti. Ogni immagine è etichettata con la cifra che rappresenta. Questo set è stato studiato così tanto che viene spesso definito il "mondo di ciao" dell'apprendimento automatico: ogni volta che si propone un nuovo algoritmo di classificazione si è curiosi di vedere come si comporterà con MNIST, e chiunque impari l'apprendimento automatico affronta questo set di dati prima o poi.
Scikit-Learn fornisce molte funzioni di aiuto per scaricare dataset popolari. MNIST è uno di questi. Il codice seguente recupera il dataset MNIST da OpenML.org.1
fromsklearn.datasetsimportfetch_openmlmnist=fetch_openml('mnist_784',as_frame