Capítulo 8. Organizar dados: Unir, combinar e remodelar
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Em muitas aplicações, os dados podem estar espalhados por vários ficheiros ou bases de dados, ou estar organizados de uma forma que não é conveniente para analisar. Este capítulo concentra-se em ferramentas que ajudam a combinar, unir e reorganizar dados.
Primeiro, introduzo o conceito de indexação hierárquica no pandas, que é utilizado extensivamente em algumas destas operações. Em seguida, exploro as manipulações de dados específicas. Podes ver várias utilizações aplicadas destas ferramentas no Capítulo 13.
8.1 Indexação hierárquica
A indexação hierárquica é uma importante caraterística do pandas que lhe permite ter vários (dois ou mais) níveis de índice num eixo. Outra forma de pensar sobre isso é que fornece uma maneira de trabalhar com dados de maior dimensão em uma forma de menor dimensão. Vamos começar com um exemplo simples: cria uma Série com uma lista de listas (ou matrizes) como índice:
In[11]:data=pd.Series(np.random.uniform(size=9),....:index=[["a","a","a","b","b","c","c","d","d"],....:[1,2,3,1,3,1,2,2,3]])In[12]:dataOut[12]:a10.92961620.31637630.183919b10.20456030.567725c10.59554520.964515d20.65317730.748907dtype:float64
O que estás a ver é uma vista embelezada de uma Série com um MultiIndex como índice. Os "intervalos" na apresentação do índice ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access