Capítulo 12. Manipulación yvisualización de datosen Python

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 8 aprendiste a manipular y visualizar datos, con gran ayuda del conjunto de paquetes tidyverse. Aquí demostraremos técnicas similares en el mismo conjunto de datos de estrellas , esta vez en Python. En concreto, utilizaremos pandas y seaborn para manipular y visualizar datos, respectivamente. Esto no es una guía exhaustiva de lo que estos módulos, o Python, pueden hacer con el análisis de datos. En cambio, es suficiente para que explores por tu cuenta.

En la medida de lo posible, reflejaré los pasos y realizaré las mismas operaciones que hicimos en el Capítulo 8. Debido a esta familiaridad, me centraré menos en los porqués de manipulando y visualizando datos que en los cómos de hacerlo en Python. Carguemos los módulos necesarios y empecemos con star. El tercer módulo de , matplotlib, es nuevo para ti y se utilizará para complementar nuestro trabajo en seaborn. Viene instalado con Anaconda. En concreto, utilizaremos el submódulo pyplot, con el alias plt.

In [1]:  import pandas as pd
         import seaborn as sns
         import matplotlib.pyplot as plt

         star = pd.read_excel('datasets/star/star.xlsx')
         star.head()
Out[1]:
   tmathssk  treadssk             classk  totexpk   sex freelunk   race  \
0       473       447        small.class        7  girl       no  white
1       536       450        small.class       21  girl       no  black
2       463       439  regular.with.aide        0   boy      yes  black
3       559       448            regular ...

Get Avanzar en la Analítica now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.