book

Criar uma organização orientada para os dados

by Carl Anderson

April 2025

Intermediate to advanced

302 pages

8h 7m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

ResumoQuem deve ler este livro?Organização do CapítuloConvenções utilizadas neste livroLivros Safari® OnlineComo contactar-nosAgradecimentos
Recolha de dadosAcesso aos dadosRelatóriosAlertaDos relatórios e alertas à análiseCaraterísticas da orientação para os dadosMaturidade da análiseVisão geral
Facetas da qualidade dos dadosDados sujosGeração de dadosEntrada de dadosDados em faltaDuplicadosDados truncadosUnidadesValores por defeitoProveniência dos dadosA qualidade dos dados é uma responsabilidade partilhada
Recolhe todas as coisasDar prioridade às fontes de dadosLiga os pontosRecolha de dadosDados de compraQuanto vale um conjunto de dados?Conservação de dados
Tipos de analistasAnalista de dadosEngenheiros de dados e engenheiros analíticosAnalistas de negóciosCientistas de dadosEstatísticosQuantsContabilistas e analistas financeirosEspecialistas em visualização de dadosA análise é um desporto de equipaCompetências e QualidadesApenas mais uma ferramentaAnálise Exploratória de Dados e Modelação EstatísticaConsultas à base de dadosInspeção e Manipulação de FicheirosEstrutura da Analytics-org
O que é a análise?Tipos de análiseAnálise descritivaAnálise exploratóriaAnálise inferencialAnálise preditivaAnálise Causal
Desenho métricoSimplesNormalizadoExatoPrecisasRelativo versus AbsolutoRobustoDiretoIndicadores-chave de desempenhoExemplos de KPIQuantos KPIs?Definições e objectivos dos KPIs
Contar históriasPrimeiros passosO que estás a tentar alcançar?Quem é o teu público?Qual é o teu meio?Vende, vende, vende!Visualização de dadosEscolher um gráficoElementos de conceção do gráficoEntregaInfográficosPainéis de controloResumo
Porquê um teste A/B?Como fazer: Melhores práticas em testes A/BAntes da experiênciaExecutar a experiênciaOutras abordagensTestes multivariadosBandidos BayesianosImplicações culturais
Como é que as decisões são tomadas?Orientado por dados, informado ou influenciado?O que dificulta a tomada de decisões?DadosCulturaAs Barreiras CognitivasOnde é que a intuição funciona?SoluçõesMotivaçãoCapacidadeAccionadoresConclusão

Cultura aberta e de confiançaLiteracia de dados alargadaCultura dos objetivos em primeiro lugarCultura inquisitiva e questionadoraCultura de aprendizagem iterativaCultura Anti-HiPPOLiderança de dados
Diretor de DadosFunção de CDOSegredos do sucessoO futuro da função de CDODiretor de AnáliseConclusão
Respeita a privacidadeFuga inadvertidaPratica a empatia Oferece a possibilidade de escolhaQualidade dos dadosSegurançaAplicação da leiConclusões
Organizações de análiseAnálise de dados e ciência de dadosTomada de decisõesVisualização de dadosTestes A/B
Problemas do tipo vizinho mais próximoProblemas de frequência relativaEstimativa de problemas de distribuição univariadaProblemas multivariados
ValorAtivação

Content preview from Criar uma organização orientada para os dados

Apêndice A. Sobre a eficácia irracional dos dados: Porque é que mais dados são mais dados é melhor?

Nota

Este anexo é reproduzido (com ligeiras modificações e correcções) de um post, com o mesmo nome, do blogue do autor.

No artigo "The unreasonable effectiveness of data,"¹ Halevy, Norvig e Pererira, todos da Google, argumentam que acontecem coisas interessantes quando os corpora atingem a escala da Web:

modelos simples e muitos dados, confunde-se com modelos mais elaborados baseados em menos dados.

Nesse artigo e na palestra técnica mais pormenorizada apresentada por Norvig, demonstram que, quando os corpora atingem centenas de milhões ou triliões de amostras ou palavras de treino, os modelos muito simples com pressupostos básicos de independência podem superar modelos mais complexos, como os baseados em ontologias cuidadosamente elaboradas com dados mais pequenos. No entanto, os autores deram relativamente poucas explicações sobre a razão pela qual mais dados são melhores. Neste apêndice, quero tentar explicar-te isso.

Proponho que existam várias classes de problemas e razões para que mais dados sejam melhores.

Problemas do tipo vizinho mais próximo

Os primeiros são problemas do tipo vizinho mais próximo. Halevy et al. dão-te um exemplo:

James Hays e Alexei A. Efros abordaram a tarefa de preenchimento de cenas: remover um automóvel ou ex-cônjuge indesejado e inestético de uma fotografia e preencher o fundo com pixéis retirados de um grande corpus de outras fotografias.

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Engenharia de software para cientistas de dados

Publisher Resources

ISBN: 9798341643017

Criar uma organização orientada para os dados

by Carl Anderson

Apêndice A. Sobre a eficácia irracional dos dados: Porque é que mais dados são mais dados é melhor?

Nota

Problemas do tipo vizinho mais próximo

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

Engenharia de software para cientistas de dados

Criar sistemas incorporados, 2ª edição

Estatísticas Práticas para Cientistas de Dados, 2ª Edição

Desenvolver aplicações com GPT-4 e ChatGPT, 2ª edição

Publisher Resources

Apêndice A. Sobre a eficácia irracional dos dados: Porque é que mais dados são mais dados é melhor?

Nota

Problemas do tipo vizinho mais próximo

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

Engenharia de software para cientistas de dados

Criar sistemas incorporados, 2ª edição

Estatísticas Práticas para Cientistas de Dados, 2ª Edição

Desenvolver aplicações com GPT-4 e ChatGPT, 2ª edição

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.