library(tidyverse)
Capítulo 18. Valores em falta
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Introdução
Já aprendeste os princípios básicos dos valores em falta no início do livro. Viste-os pela primeira vez no Capítulo 1, onde resultaram num aviso ao fazer um gráfico, bem como em "summarize()", onde interferiram com o cálculo das estatísticas de resumo, e aprendeste sobre a sua natureza infecciosa e como verificar a sua presença em "Missing Values". Agora vamos voltar a elas com mais profundidade para que possas aprender mais detalhes.
Começaremos por discutir algumas ferramentas gerais para trabalhar com valores em falta registados como NAs. Em seguida, exploraremos a ideia de valores em falta implícitos, valores que estão simplesmente ausentes dos seus dados, e mostraremos algumas ferramentas que pode utilizar para os tornar explícitos. Terminaremos com uma discussão relacionada com grupos vazios, causados por níveis de factores que não aparecem nos dados.
Pré-requisitos
As funções para trabalhar com dados em falta provêm maioritariamente do dplyr e do tidyr, que são membros centrais do tidyverse.
Valores em falta explícitos
Para começar, vamos explorar algumas ferramentas úteis para criar ou eliminar valores explícitos em falta, ou seja, células onde vê um NA.
Última observação transitada
Uma utilização comum dos valores em falta é a conveniência da introdução de dados. Quando os dados são ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access