Skip to Content
Recetario de Aprendizaje Automático con Python, 2ª Edición
book

Recetario de Aprendizaje Automático con Python, 2ª Edición

by Kyle Gallatin, Chris Albon
September 2024
Intermediate to advanced
416 pages
8h 38m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Recetario de Aprendizaje Automático con Python, 2ª Edición

Capítulo 3. Gestión de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

3.0 Introducción

La manipulación de datos es un término amplio que se utiliza, a menudo de manera informal, para describir el proceso de transformación de datos brutos en un formato limpio y organizado, listo para su uso. Para nosotros, la manipulación de datos es sólo un paso en el preprocesamiento de nuestros datos, pero es un paso importante.

La estructura de datos más utilizada para "manejar" datos es el marco de datos , que puede ser intuitivo e increíblemente versátil. Los marcos de datos son tabulares, es decir, se basan en filas y columnas como las que verías en una hoja de cálculo. Aquí tienes un marco de datos creado a partir de datos sobre los pasajeros del Titanic:

# Load library
import pandas as pd

# Create URL
url = 'https://raw.githubusercontent.com/chrisalbon/sim_data/master/titanic.csv'

# Load data as a dataframe
dataframe = pd.read_csv(url)

# Show first five rows
dataframe.head(5)
Nombre Clase PC Edad Sexo Sobrevivido CódigoSexo
0 Allen, Srta. Elisabeth Walton 29.00 mujer 1 1
1 Allison, Srta. Helen Loraine 2.00 mujer 0 1
2 Allison, Sr. Hudson Joshua Creighton 30.00 hombre 0 0
3 Allison, Sra. Hudson JC (Bessie Waldo Daniels) 25.00 mujer 0 1
4 Allison, Maestro Hudson Trevor 0.92 hombre 1 0

Hay tres cosas importantes que observar en este marco de datos.

En primer lugar, en un marco de ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Patrones de Arquitectura con Python

Patrones de Arquitectura con Python

Harry Percival, Bob Gregory
Planos para el análisis de textos con Python

Planos para el análisis de textos con Python

Jens Albrecht, Sidharth Ramachandran, Christian Winkler
Arquitectura de Plataformas de Datos y Aprendizaje Automático

Arquitectura de Plataformas de Datos y Aprendizaje Automático

Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner

Publisher Resources

ISBN: 9781098186814Supplemental Content