O'Reilly logo

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

Datenanalyse mit Python

Book Description

Dieses konsequent praxisbezogene Buch zeigt Ihnen anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen mit Python-Bibliotheken wie Pandas, NumPy und IPython lösen.Es bietet zudem einen praktischen Einstieg in das wissenschaftliche Computing für datenintensive Anwendungen mit Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in das wissenschaftliche Computing einarbeiten wollen.

Table of Contents

  1. Cover
  2. Titel
  3. Impressum
  4. Kapitel 1: Einleitung
    1. Wovon handelt dieses Buch?
    2. Warum Python zur Datenanalyse?
    3. Essenzielle Python-Bibliotheken
    4. Installation und Einrichtung
    5. Community und Konferenzen
    6. Navigation durch dieses Buch
    7. Typografische Konventionen
    8. Benutzung von Codebeispielen
    9. Danksagungen
  5. Kapitel 2: Einführende Beispiele
    1. 1.USA.gov-Daten von bit.ly
    2. MovieLens 1M Data Set
    3. US-Babynamen von 1880 bis 2010
    4. Fazit und der Weg vor Ihnen
  6. Kapitel 3: IPython: Eine interaktive Rechen- und Entwicklungsumgebung
    1. IPython-Grundlagen
    2. Verwenden der Befehlschronik
    3. Interaktion mit dem Betriebssystem
    4. Werkzeuge zur Softwareentwicklung
    5. IPython HTML Notebook
    6. Tipps zur produktiven Codeentwicklung mit IPython
    7. Fortgeschrittene Features von IPython
    8. Danksagung
  7. Kapitel 4: Grundlagen von NumPy: Arrays und vektorisierte Berechnung
    1. Das ndarray von NumPy: ein mehrdimensionales Array-Objekt
    2. Universelle Funktionen: Schnelle elementweise Array-Funktionen
    3. Datenverarbeitung mit Arrays
    4. Dateiein- und -ausgabe bei Arrays
    5. Lineare Algebra
    6. Erzeugen von Zufallszahlen
    7. Beispiel: Random Walks
  8. Kapitel 5: Erste Schritte mit pandas
    1. Einführung in die Datenstrukturen von pandas
    2. Essenzielle Funktionalität
    3. Zusammenfassen und Berechnen deskriptiver Statistik
    4. Behandlung fehlender Daten
    5. Hierarchisches Indizieren
    6. Weitere Themen in pandas
  9. Kapitel 6: Laden und Speichern von Daten sowie Dateiformate
    1. Lesen und Schreiben von Daten im Textformat
    2. Binäre Datenformate
    3. Interagieren mit HTML und Web-APIs
    4. Interaktion mit Datenbanken
  10. Kapitel 7: Datenaufbereitung: Säubern, Transformieren, Verknüpfen und Umformen
    1. Kombinieren und Verknüpfen von Datensätzen
    2. Umformen und Transponieren
    3. Transformieren von Daten
    4. Manipulation von Strings
    5. Fallstudie: Die USDA-Nahrungsmitteldatenbank
  11. Kapitel 8: Plotten und Visualisieren
    1. Kurze Einführung in die matplotlib-API
    2. Plotten von Funktionen in pandas
    3. Karten zeichnen: Visualisieren der Daten aus der Erdbebenkrise auf Haiti
    4. Das Ökosystem der Visualisierungstools in Python
  12. Kapitel 9: Aggregation von Daten und Gruppenoperationen
    1. GroupBy-Mechanismen
    2. Aggregation von Daten
    3. Gruppenweise Operationen und Transformationen
    4. Pivot-Tabellen und Kreuztabellierung
    5. Fallstudie: Die Datenbank des US-Bundeswahlausschusses von 2012
  13. Kapitel 10: Zeitreihen
    1. Datentypen und Werkzeuge für Datum und Zeit
    2. Grundlagen von Zeitreihen
    3. Datumsbereiche, Frequenzen und Verschiebungen
    4. Berücksichtigung von Zeitzonen
    5. Perioden und Arithmetik von Perioden
    6. Resampling und Konvertieren von Frequenzen
    7. Plotten von Zeitreihen
    8. Funktionen mit gleitenden Fenstern
    9. Notizen zu Rechengeschwindigkeit und Speichernutzung
  14. Kapitel 11: Anwendungen auf Daten aus Finanzwelt und Ökonomie
    1. Themen aus der Datenklempnerei
    2. Gruppentransformationen und Analyse
    3. Weitere Anwendungsbeispiele
  15. Kapitel 12: NumPy für Fortgeschrittene
    1. Interna von ndarray-Objekten
    2. Fortgeschrittene Manipulation von Arrays
    3. Broadcasting
    4. Fortgeschrittene Nutzung von ufuncs
    5. Strukturierte und Record-Arrays
    6. Mehr zum Thema Sortieren
    7. Die Klasse Matrix in NumPy
    8. Ein- und Ausgabe von Arrays für Fortgeschrittene
    9. Tipps für höhere Leistung
  16. Anhang: Grundlagen der Programmiersprache Python
  17. Index
  18. Über den Autor
  19. Über die Übersetzer
  20. Kolophon
  21. Fußnoten