Kapitel 12. Datenmanipulation undVisualisierung in Python
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In Kapitel 8 hast du gelernt, wie du Daten manipulieren und visualisieren kannst, und zwar mit Hilfe der Pakete von tidyverse
. Hier demonstrieren wir ähnliche Techniken mit demselben Star-Datensatz, dieses Mal in Python. Insbesondere werden wir pandas
und seaborn
verwenden, um Daten zu manipulieren bzw. zu visualisieren. Dies ist keine umfassende Anleitung zu den Möglichkeiten, die diese Module oder Python bei der Datenanalyse bieten. Stattdessen reicht es aus, wenn du auf eigene Faust forschen kannst.
Ich werde so weit wie möglich die gleichen Schritte und Operationen durchführen wie in Kapitel 8. Aufgrund dieser Vertrautheit werde ich mich weniger auf das Warum der Datenbearbeitung und -visualisierung konzentrieren, sondern mehr auf das Wie der Arbeit in Python. Laden wir die notwendigen Module und fangen wir mit star an. Das dritte Modul, matplotlib
, ist neu für dich und wird unsere Arbeit in seaborn
ergänzen. Es wird mit Anaconda installiert. Wir werden vor allem das Submodul pyplot
verwenden, das wir als plt
kennzeichnen.
In
[
1
]:
import
pandas
as
pd
import
seaborn
as
sns
import
matplotlib.pyplot
as
plt
star
=
pd
.
read_excel
(
'datasets/star/star.xlsx'
)
star
.
head
()
Out
[
1
]:
tmathssk
treadssk
classk
totexpk
sex
freelunk
race
\0
473
447
small
.
class
7
girl
no
white
1
536
450
small
.
class
Get Vorstoß in die Analytik now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.