Skip to Main Content
Recetario de Aprendizaje Automático con Python, 2ª Edición
book

Recetario de Aprendizaje Automático con Python, 2ª Edición

by Kyle Gallatin, Chris Albon
September 2024
Intermediate to advanced content levelIntermediate to advanced
416 pages
8h 38m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Recetario de Aprendizaje Automático con Python, 2ª Edición

Capítulo 4. Tratamiento de datos numéricos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

4.0 Introducción

Datos cuantitativos son la medida de algo, ya sea el tamaño de una clase, las ventas mensuales o los resultados de los estudiantes. La forma natural de representar estas cantidades es numéricamente (por ejemplo, 29 alumnos, 529.392 $ en ventas). En este capítulo, cubriremos numerosas estrategias para transformar datos numéricos brutos en características creadas específicamente para algoritmos de aprendizaje automático.

4.1 Reescalar una característica

Problema

Necesitas reescalar los valores de una característica numérica para que estén entre dos valores.

Solución

Utiliza MinMaxScaler de scikit-learn para reescalar una matriz de características:

# Load libraries
import numpy as np
from sklearn import preprocessing

# Create feature
feature = np.array([[-500.5],
                    [-100.1],
                    [0],
                    [100.1],
                    [900.9]])

# Create scaler
minmax_scale = preprocessing.MinMaxScaler(feature_range=(0, 1))

# Scale feature
scaled_feature = minmax_scale.fit_transform(feature)

# Show feature
scaled_feature
array([[ 0.        ],
       [ 0.28571429],
       [ 0.35714286],
       [ 0.42857143],
       [ 1.        ]])

Debate

El reescalado es una tarea de preprocesamiento habitual en el aprendizaje automático. Muchos de los algoritmos que se describen más adelante en este libro supondrán que todas las características están en la misma escala, normalmente de 0 a 1 o de -1 a 1. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Visualización de Datos con Python y JavaScript, 2ª Edición

Visualización de Datos con Python y JavaScript, 2ª Edición

Kyran Dale
Arquitectura de Plataformas de Datos y Aprendizaje Automático

Arquitectura de Plataformas de Datos y Aprendizaje Automático

Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner
Análisis de Texto Aplicado con Python

Análisis de Texto Aplicado con Python

Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda

Publisher Resources

ISBN: 9781098186814Supplemental Content