Kapitel 9. Vergleiche, Masken und Boolesche Logik

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel geht es um die Verwendung von booleschen Masken zur Untersuchung und Bearbeitung von Werten in NumPy-Arrays. Die Maskierung kommt zum Einsatz, wenn du Werte in einem Array anhand eines bestimmten Kriteriums extrahieren, ändern, zählen oder anderweitig manipulieren möchtest: Du möchtest zum Beispiel alle Werte zählen, die größer als ein bestimmter Wert sind, oder alle Ausreißer entfernen, die über einem bestimmten Schwellenwert liegen. In NumPy ist die boolesche Maskierung oft der effizienteste Weg, um diese Art von Aufgaben zu erledigen.

Beispiel: Regentage zählen

Stell dir vor, du hast eine Reihe von Daten, die die Niederschlagsmenge eines jeden Tages in einer bestimmten Stadt darstellen. Hier laden wir zum Beispiel die täglichen Niederschlagsstatistiken für die Stadt Seattle im Jahr 2015 mit Pandas (sieheTeil III):

In [1]: import numpy as np
        from vega_datasets import data

        # Use DataFrame operations to extract rainfall as a NumPy array
        rainfall_mm = np.array(
            data.seattle_weather().set_index('date')['precipitation']['2015'])
        len(rainfall_mm)
Out[1]: 365

Das Array enthält 365 Werte, die die tägliche Niederschlagsmenge in Millimetern vom 1. Januar bis 31. Dezember 2015 angeben.

Als erste schnelle Visualisierung sehen wir uns das Histogramm der Regentage in Abbildung 9-1 an, das ...

Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.