Capítulo 10. Agregação de dados e operações de grupo
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Categorizar um conjunto de dados e aplicar uma função a cada grupo, seja umaagregação ou transformação, pode ser um componente crítico de um fluxo de trabalho de análise de dados. Depois de carregar, fundir e preparar um conjunto de dados, pode ser necessário calcular estatísticas de grupo ou, possivelmente, tabelas dinâmicas para fins de relatório ou visualização. O pandas fornece uma interface groupby versátil, permitindo cortar, cortar e resumir conjuntos de dados de uma forma natural.
Uma das razões para a popularidade das bases de dados relacionais e da SQL (que significa "linguagem de consulta estruturada") é a facilidade com que os dados podem ser unidos, filtrados, transformados e agregados. No entanto, as linguagens de consulta como a SQL impõem certas limitações aos tipos de operações de grupo que podem ser realizadas. Como verás, com a expressividade do Python e do pandas, podemos realizar operações de grupo bastante complexas, expressando-as como funções Python personalizadas que manipulam os dados associados a cada grupo. Neste capítulo, aprenderás a:
Divide um objeto pandas em partes utilizando uma ou mais chaves (sob a forma de funções, matrizes ou nomes de colunas DataFrame)
Calcula estatísticas de resumo do grupo, como contagem, média ou desvio padrão, ou uma função definida pelo utilizador
Aplica ...