Parte I. O jogo completo
O nosso objetivo nesta parte do livro é dar-te uma visão geral rápida das principais ferramentas da ciência de dados: importar, Tidy, transformar e visualizar dados, como mostrado na Figura I-1. Queremos mostrar-te o "jogo completo" da ciência de dados, dando-te apenas o suficiente de todas as peças principais para que possas lidar com conjuntos de dados reais, embora simples. As partes posteriores do livro abordarão cada um destes tópicos com mais profundidade, aumentando a gama de desafios da ciência de dados que podes enfrentar.

Figura I-1. Nesta secção do livro, aprenderás a importar, Tidy, transformar e visualizar dados.
Quatro capítulos centram-se nas ferramentas da ciência dos dados:
A visualização é um ótimo ponto de partida para a programação em R, porque a recompensa é muito clara: podes fazer gráficos elegantes e informativos que te ajudam a compreender os dados. No Capítulo 1, mergulharás na visualização, aprendendo a estrutura básica de um gráfico ggplot2 e técnicas poderosas para transformar dados em gráficos.
A visualização por si só não é suficiente, por isso, no Capítulo 3, aprenderás os verbos chave que te permitem selecionar variáveis importantes, filtrar observações chave, criar novas variáveis e calcular resumos.
No Capítulo 5, aprenderás sobre os dados Tidy, uma forma consistente de armazenar os dados que facilita a transformação, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access