Capítulo 10. Análise exploratória de dados
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Introdução
Este capítulo mostra como utilizar a visualização e a transformação para explorar os seus dados de forma sistemática, uma tarefa que os estatísticos designam por análise exploratória de dados, ou EDA, abreviadamente. A EDA é um ciclo iterativo. Tu:
Gera perguntas sobre os teus dados.
Procura respostas visualizando, transformando e modelando os teus dados.
Utiliza o que aprendeste para aperfeiçoar as tuas perguntas e/ou criar novas perguntas.
A EDA não é um processo formal com um conjunto rigoroso de regras. Mais do que tudo, a EDA é um estado de espírito. Durante as fases iniciais da EDA, deves sentir-te livre para investigar todas as ideias que te ocorrerem. Algumas destas ideias vão dar certo e outras serão becos sem saída. À medida que a tua exploração continua, irás encontrar algumas ideias particularmente produtivas que acabarás por escrever e comunicar a outros.
A AED é uma parte importante de qualquer análise de dados, mesmo que as questões primárias de pesquisa te sejam entregues de bandeja, porque tens sempre de investigar a qualidade dos teus dados. A limpeza de dados é apenas uma aplicação da AED: faz perguntas sobre se os seus dados correspondem às suas expectativas. Para fazer a limpeza de dados, é necessário utilizar todas as ferramentas da AED: visualização, transformação e modelação.
Pré-requisitos ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access