Rozdział 10. Agregacja danych i operacje wykonywane na grupach

Często jednym z najważniejszych etapów pracy z danymi jest kategoryzacja zbioru i zastosowanie funkcji do jego poszczególnych grup. Po załadowaniu, połączeniu i przygotowaniu zbioru danych może zachodzić konieczność uzyskania parametrów statystycznych dla jego poszczególnych grup lub tabel przestawnych w celu wizualizacji danych lub utworzenia raportu. Pakiet pandas jest wyposażony w elastyczny interfejs groupby umożliwiający naturalne dzielenie i podsumowywanie zbiorów danych.

Jednym z powodów popularności relacyjnych baz danych i języka strukturalnych zapytań SQL jest łatwość łączenia, filtrowania i agregacji danych. Języki zapytań, jak SQL, są nieco ograniczone, jeżeli chodzi ...

Get Python w analizie danych now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.