Capítulo 3. Clasificación
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el Capítulo 1 mencioné que las tareas de aprendizaje supervisado más comunes son la regresión (predicción de valores) y la clasificación (predicción de clases). En el Capítulo 2 exploramos una tarea de regresión, la predicción de valores de viviendas, utilizando diversos algoritmos como la regresión lineal, los árboles de decisión y los bosques aleatorios (que se explicarán con más detalle en capítulos posteriores). Ahora centraremos nuestra atención en los sistemas de clasificación.
MNIST
En este capítulo utilizaremos el conjunto de datos MNIST, que es un conjunto de 70.000 pequeñas imágenes de dígitos escritas a mano por estudiantes de secundaria y empleados de la Oficina del Censo de EEUU. Cada imagen está etiquetada con el dígito que representa. Este conjunto se ha estudiado tanto que a menudo se le llama el "hola mundo" del aprendizaje automático: cada vez que la gente inventa un nuevo algoritmo de clasificación, tiene curiosidad por ver cómo funcionará en MNIST, y cualquiera que aprenda aprendizaje automático aborda este conjunto de datos tarde o temprano.
Scikit-Learn proporciona muchas funciones de ayuda para descargar conjuntos de datos populares. MNIST es uno de ellos. El siguiente código obtiene el conjunto de datos MNIST de OpenML.org.1
from
sklearn.datasets
import
fetch_openml
mnist
=
fetch_openml
(
'mnist_784'
,
as_frame ...
Get Aprendizaje automático práctico con Scikit-Learn, Keras y TensorFlow, 3ª edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.