Capítulo 12. Manipulación yvisualización de datosen Python
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el Capítulo 8 aprendiste a manipular y visualizar datos, con gran ayuda del conjunto de paquetes tidyverse
. Aquí demostraremos técnicas similares en el mismo conjunto de datos de estrellas , esta vez en Python. En concreto, utilizaremos pandas
y seaborn
para manipular y visualizar datos, respectivamente. Esto no es una guía exhaustiva de lo que estos módulos, o Python, pueden hacer con el análisis de datos. En cambio, es suficiente para que explores por tu cuenta.
En la medida de lo posible, reflejaré los pasos y realizaré las mismas operaciones que hicimos en el Capítulo 8. Debido a esta familiaridad, me centraré menos en los porqués de manipulando y visualizando datos que en los cómos de hacerlo en Python. Carguemos los módulos necesarios y empecemos con star. El tercer módulo de , matplotlib
, es nuevo para ti y se utilizará para complementar nuestro trabajo en seaborn
. Viene instalado con Anaconda. En concreto, utilizaremos el submódulo pyplot
, con el alias plt
.
In
[
1
]:
import
pandas
as
pd
import
seaborn
as
sns
import
matplotlib.pyplot
as
plt
star
=
pd
.
read_excel
(
'datasets/star/star.xlsx'
)
star
.
head
()
Out
[
1
]:
tmathssk
treadssk
classk
totexpk
sex
freelunk
race
\0
473
447
small
.
class
7
girl
no
white
1
536
450
small
.
class
21
girl
no
black
2
463
439
regular
.
with
.
aide
0
boy
yes
black
3
559
448
regular ...
Get Avanzar en la Analítica now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.