Rozdział 10. Agregacja danych i operacje wykonywane na grupach

Często jednym z najważniejszych etapów pracy z danymi jest kategoryzacja zbioru i zastosowanie funkcji do jego poszczególnych grup. Po załadowaniu, połączeniu i przygotowaniu zbioru danych może zachodzić konieczność uzyskania parametrów statystycznych dla jego poszczególnych grup lub tabel przestawnych w celu wizualizacji danych lub utworzenia raportu. Pakiet pandas jest wyposażony w elastyczny interfejs groupby umożliwiający naturalne dzielenie i podsumowywanie zbiorów danych.

Jednym z powodów popularności relacyjnych baz danych i języka strukturalnych zapytań SQL jest łatwość łączenia, filtrowania i agregacji danych. Języki zapytań, jak SQL, są nieco ograniczone, jeżeli chodzi ...

Get Python w analizie danych now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.