Kapitel 12. Datenmanipulation undVisualisierung in Python

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kapitel 8 hast du gelernt, wie du Daten manipulieren und visualisieren kannst, und zwar mit Hilfe der Pakete von tidyverse. Hier demonstrieren wir ähnliche Techniken mit demselben Star-Datensatz, dieses Mal in Python. Insbesondere werden wir pandas und seaborn verwenden, um Daten zu manipulieren bzw. zu visualisieren. Dies ist keine umfassende Anleitung zu den Möglichkeiten, die diese Module oder Python bei der Datenanalyse bieten. Stattdessen reicht es aus, wenn du auf eigene Faust forschen kannst.

Ich werde so weit wie möglich die gleichen Schritte und Operationen durchführen wie in Kapitel 8. Aufgrund dieser Vertrautheit werde ich mich weniger auf das Warum der Datenbearbeitung und -visualisierung konzentrieren, sondern mehr auf das Wie der Arbeit in Python. Laden wir die notwendigen Module und fangen wir mit star an. Das dritte Modul, matplotlib, ist neu für dich und wird unsere Arbeit in seaborn ergänzen. Es wird mit Anaconda installiert. Wir werden vor allem das Submodul pyplot verwenden, das wir als plt kennzeichnen.

In [1]:  import pandas as pd
         import seaborn as sns
         import matplotlib.pyplot as plt

         star = pd.read_excel('datasets/star/star.xlsx')
         star.head()
Out[1]:
   tmathssk  treadssk             classk  totexpk   sex freelunk   race  \
0       473       447        small.class        7  girl       no  white
1       536       450        small.class       

Get Vorstoß in die Analytik now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.