Capítulo 6. Carregamento de dados, armazenamento e formatos de ficheiros
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Ler dados e torná-los acessíveis (frequentemente designado por carregamento de dados) é um primeiro passo necessário para utilizar a maioria das ferramentas deste livro. O termo "parsing " também é por vezes utilizado para descrever o carregamento de dados de texto e a sua interpretação como tabelas e diferentes tipos de dados. Vou concentrar-me na entrada e saída de dados utilizando pandas, embora existam inúmeras ferramentas noutras bibliotecas para ajudar a ler e escrever dados em vários formatos.
A entrada e a saída dividem-se normalmente em algumas categorias principais: leitura de ficheiros de texto e outros formatos mais eficientes no disco, carregamento de dados de bases de dados e interação com fontes de rede, como APIs da Web.
6.1 Ler e escrever dados em formato de texto
O pandas apresenta várias funções para ler dados tabulares como um objeto DataFrame. A Tabela 6-1 resume algumas delas; pandas.read_csv é uma das mais frequentemente utilizadas neste livro. Veremos os formatos de dados binários mais tarde na Secção 6.2, "Formatos de dados binários".
| Função | Descrição |
|---|---|
read_csv | Carrega dados delimitados de um ficheiro, URL ou objeto semelhante a um ficheiro; utiliza a vírgula como delimitador predefinido |
read_fwf |
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access