Parte IV. Importação
Nesta parte do livro, aprenderás a importar uma gama mais vasta de dados para o R, bem como a colocá-los numa forma útil para análise. Por vezes, isto é apenas uma questão de chamar uma função do pacote de importação de dados apropriado. Mas, em casos mais complexos, pode ser necessário arrumar e transformar os dados para chegar ao retângulo Tidy com que preferes trabalhar.
Figura IV-1. A importação de dados é o início do processo de ciência de dados; sem dados não podes fazer ciência de dados!
Nesta parte do livro, aprenderás a aceder aos dados armazenados das seguintes formas:
No Capítulo 20, aprenderás a importar dados de folhas de cálculo do Excel e do Google Sheets.
No Capítulo 21, aprenderás a retirar dados de uma base de dados para o R (e também aprenderás um pouco sobre como retirar dados do R para uma base de dados).
No Capítulo 22, aprenderás sobre o Arrow, uma ferramenta poderosa para trabalhar com dados fora da memória, particularmente quando são armazenados no formato parquet.
No Capítulo 23, aprenderás a trabalhar com dados hierárquicos, incluindo as listas profundamente aninhadas produzidas por dados armazenados no formato JSON.
No Capítulo 24, aprenderás a fazer "scraping" na Web, a arte e a ciência de extrair dados de páginas Web.
Existem dois pacotes tidyverse importantes que não discutimos aqui: haven e xml2. Se estiveres a trabalhar com ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access