Rozdział 20. Agregacja i grupowanie
Podstawowym elementem wielu zadań związanych z analizą danych jest podsumowywanie danych za pomocą funkcji takich jak sum
, mean
, median
, min
oraz max
. Funkcje te pozwalają podsumować potencjalnie duży zbiór danych w postaci jednej wartości. W tym rozdziale przyjrzymy się agregacji w Pandas. Przedstawię zarówno proste operacje podobne do tych, które wykonywaliśmy już na tablicach NumPy, jak i bardziej wyrafinowane operacje oparte na koncepcji grupowania.
Dla wygody w tym rozdziale ponownie skorzystam z magicznej funkcji display
, którą wykorzystałem już w poprzednich rozdziałach:
In [1]: import numpy as np
import pandas as pd
class display(object):
"""Funkcja wyświetlająca reprezentację HTML wielu obiektów.""" ...
Get Python Data Science now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.