Skip to Content
R for Data Science, 2ª Edição
book

R for Data Science, 2ª Edição

by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
April 2025
Intermediate to advanced
578 pages
13h 35m
Portuguese (Portugal, Brazil)
O'Reilly Media, Inc.
Content preview from R for Data Science, 2ª Edição

Capítulo 10. Análise exploratória de dados

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Introdução

Este capítulo mostra como utilizar a visualização e a transformação para explorar os seus dados de forma sistemática, uma tarefa que os estatísticos designam por análise exploratória de dados, ou EDA, abreviadamente. A EDA é um ciclo iterativo. Tu:

  1. Gera perguntas sobre os teus dados.

  2. Procura respostas visualizando, transformando e modelando os teus dados.

  3. Utiliza o que aprendeste para aperfeiçoar as tuas perguntas e/ou criar novas perguntas.

A EDA não é um processo formal com um conjunto rigoroso de regras. Mais do que tudo, a EDA é um estado de espírito. Durante as fases iniciais da EDA, deves sentir-te livre para investigar todas as ideias que te ocorrerem. Algumas destas ideias vão dar certo e outras serão becos sem saída. À medida que a tua exploração continua, irás encontrar algumas ideias particularmente produtivas que acabarás por escrever e comunicar a outros.

A AED é uma parte importante de qualquer análise de dados, mesmo que as questões primárias de pesquisa te sejam entregues de bandeja, porque tens sempre de investigar a qualidade dos teus dados. A limpeza de dados é apenas uma aplicação da AED: faz perguntas sobre se os seus dados correspondem às suas expectativas. Para fazer a limpeza de dados, é necessário utilizar todas as ferramentas da AED: visualização, transformação e modelação.

Pré-requisitos ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

R para Data Science

R para Data Science

Hadley Wickham, Garrett Grolemund
Data Science Para Negócios

Data Science Para Negócios

Foster Provost, Tom Fawcett

Publisher Resources

ISBN: 9798341641976