Data Science do Zero

Book description

As bibliotecas, estruturas, módulos e kits de ferramentas do data science são ótimas para desempenhá-lo mas, também, são uma ótima forma de mergulhar na disciplina sem ter, de fato, que entender data science. Neste livro, você aprenderá como os algoritmos e as ferramentas mais essenciais de data science funcionam ao implementá-los do zero. Se você tiver aptidão para matemática e alguma habilidade para programação, o autor Joel Grus lhe ajudará a se sentir confortável com matemática e estatística nos fundamentos de data science. Você precisará iniciar como um cientista de dados com habilidades de hackers. Atualmente, a grande massa de dados contém respostas para perguntas que ninguém nunca pensou em perguntar. Este guia fornece o conhecimento para desenterrar tais respostas. Obtenha um curso intensivo em Python; Aprenda o básico de álgebra linear, estatística e probabilidade — e entenda como e quando eles são usados em data science; Colete, explore, limpe, mude e manipule dados.

Table of contents

  1. Capa
  2. Folha de rosto
  3. Créditos
  4. Sumário
  5. Prefácio
  6. Agradecimentos
  7. 1. Introdução
    1. A Ascensão dos Dados
    2. O Que É Data Science?
    3. Motivação Hipotética: DataSciencester
      1. Encontrando Conectores-Chave
      2. Cientistas de Dados Que Você Talvez Conheça
      3. Salários e Experiência
      4. Contas Pagas
      5. Tópicos de Interesse
      6. Em Diante
  8. 2. Curso Relâmpago de Python
    1. O Básico
      1. Iniciando em Python
      2. Python Zen
      3. Formatação de Espaço em Branco
      4. Módulos
      5. Aritmética
      6. Funções
      7. Strings (cadeias de caracteres)
      8. Exceções
      9. Listas
      10. Tuplas
      11. Dicionários
      12. Conjuntos
      13. Controle de Fluxo
      14. Veracidade
    2. Não Tão Básico
      1. Ordenação
      2. Compreensões de Lista
      3. Geradores e Iteradores
      4. Aleatoriedade
      5. Expressões Regulares
      6. Programação Orientada a Objeto
      7. Ferramentas Funcionais
      8. Enumeração (enumerate)
      9. Descompactação de Zip e Argumentos
      10. args e kwargs
      11. Bem-vindo à DataSciencester!
    3. Para Mais Esclarecimentos
  9. 3. Visualizando Dados
    1. matplotlib
    2. Gráficos de Barra
    3. Gráficos de Linhas
    4. Gráficos de Dispersão
    5. Para Mais Esclarecimentos
  10. 4. Álgebra Linear
    1. Vetores
    2. Matrizes
    3. Para Mais Esclarecimentos
  11. 5. Estatística
    1. Descrevendo um Conjunto Único de Dados
      1. Tendências Centrais
      2. Dispersão
    2. Correlação
    3. Paradoxo de Simpson
    4. Alguns Outros Pontos de Atenção sobre Correlação
    5. Correlação e Causalidade
    6. Para Mais Esclarecimentos
  12. 6. Probabilidade
    1. Dependência e Independência
    2. Probabilidade Condicional
    3. Teorema de Bayes
    4. Variáveis Aleatórias
    5. Distribuições Contínuas
    6. A Distribuição Normal
    7. O Teorema do Limite Central
    8. Para Mais Esclarecimentos
  13. 7. Hipótese e Inferência
    1. Teste Estatístico de Hipótese
    2. Exemplo: Lançar Uma Moeda
    3. p-values
    4. Intervalos de Confiança
    5. P-Hacking
    6. Exemplo: Executando um Teste A/B
    7. Inferência Bayesiana
    8. Para Mais Esclarecimentos
  14. 8. Gradiente Descendente
    1. A Ideia Por Trás do Gradiente Descendente
    2. Estimando o Gradiente
    3. Usando o Gradiente
    4. Escolhendo o Tamanho do Próximo Passo
    5. Juntando Tudo
    6. Gradiente Descendente Estocástico
    7. Para Mais Esclarecimentos
  15. 9. Obtendo Dados
    1. stdin e stdout
    2. Lendo Arquivos
      1. O Básico de Arquivos Texto
      2. Arquivos delimitados
    3. Extraindo Dados da Internet
      1. HTML e Sua Subsequente Pesquisa
      2. Exemplo: Livros O’Reilly Sobre Dados
    4. Usando APIs
      1. JSON (e XML)
      2. Usando Uma API Não Autenticada
      3. Encontrando APIs
    5. Exemplo: Usando as APIs do Twitter
      1. Obtendo Credenciais
    6. Para Mais Esclarecimentos
  16. 10. Trabalhando com Dados
    1. Explorando Seus Dados
      1. Explorando Dados Unidimensionais
      2. Duas Dimensões
      3. Muitas Dimensões
    2. Limpando e Transformando
    3. Manipulando Dados
    4. Redimensionando
    5. Redução da Dimensionalidade
    6. Para Mais Esclarecimentos
  17. 11. Aprendizado de Máquina
    1. Modelagem
    2. O Que É Aprendizado de Máquina?
    3. Sobreajuste e Sub-Ajuste
    4. Precisão
    5. Compromisso entre Polarização e Variância
    6. Recursos Extração e Seleção de Característica
    7. Para Mais Esclarecimentos
  18. 12. K–Vizinhos Mais Próximos
    1. O Modelo
    2. Exemplo: Linguagens Favoritas
    3. A Maldição da Dimensionalidade
    4. Para Mais Esclarecimentos
  19. 13. Naive Bayes
    1. Um Filtro de Spam Muito Estúpido
    2. Um Filtro de Spam Mais Sofisticado
    3. Implementação
    4. Testando Nosso Modelo
    5. Para Mais Esclarecimentos
  20. 14. Regressão Linear Simples
    1. O Modelo
    2. Usando o Gradiente Descendente
    3. Estimativa Máxima da Probabilidade
    4. Para Mais Esclarecimentos
  21. 15. Regressão Múltipla
    1. O Modelo
    2. Mais Suposições do Modelo dos Mínimos Quadrados
    3. Ajustando o Modelo
    4. Interpretando o Modelo
    5. O Benefício do Ajuste
    6. Digressão: A Inicialização
    7. Erros Padrões de Coeficientes de Regressão
    8. Regularização
    9. Para Mais Esclarecimentos
  22. 16. Regressão Logística
    1. O Problema
    2. A Função Logística
    3. Aplicando o Modelo
    4. O Benefício do Ajuste
    5. Máquina de Vetor de Suporte
    6. Para Mais Esclarecimentos
  23. 17. Árvores de Decisão
    1. O Que É uma Árvore de Decisão?
    2. Entropia
    3. A Entropia de uma Partição
    4. Criando uma Árvore de Decisão
    5. Juntando Tudo
    6. Florestas Aleatórias
    7. Para Maiores Esclarecimentos
  24. 18. Redes Neurais
    1. Perceptrons
    2. Redes Neurais Feed-Forward
    3. Backpropagation
    4. Exemplo: Derrotando um CAPTCHA
    5. Para Mais Esclarecimentos
  25. 19. Agrupamento
    1. A Ideia
    2. O Modelo
    3. Exemplo: Encontros
    4. Escolhendo k
    5. Exemplo: Agrupando Cores
    6. Agrupamento Hierárquico Bottom-up
    7. Para Mais Esclarecimentos
  26. 20. Processamento de Linguagem Natural
    1. Nuvens de Palavras
    2. Modelos n-gramas
    3. Gramáticas
    4. Um Adendo: Amostragem de Gibbs
    5. Modelagem de Tópicos
    6. Para Mais Esclarecimentos
  27. 21. Análise de Rede
    1. Centralidade de Intermediação
    2. Centralidade de Vetor Próprio
      1. Multiplicação de Matrizes
      2. Centralidade
    3. Gráficos Direcionados e PageRank
    4. Para Mais Esclarecimentos
  28. 22. Sistemas Recomendadores
    1. Curadoria Manual
    2. Recomendando O Que é Popular
    3. Filtragem Colaborativa Baseada no Usuário
    4. Filtragem Colaborativa Baseada em Itens
    5. Para Mais Esclarecimentos
  29. 23. Bases de Dados e SQL
    1. CREATE TABLE e INSERT
    2. UPDATE
    3. DELETE
    4. SELECT
    5. GROUP BY
    6. ORDER BY
    7. JOIN
    8. Subconsultas
    9. Índices
    10. Otimização de Consulta
    11. NoSQL
    12. Para Mais Esclarecimentos
  30. 24. MapReduce
    1. Exemplo: Contagem de Palavras
    2. Por que MapReduce?
    3. MapReduce Mais Generalizado
    4. Exemplo: Analisando Atualizações de Status
    5. Exemplo: Multiplicação de Matriz
    6. Um Adendo: Combinadores
    7. Para Mais Esclarecimentos
  31. 25. Vá em Frente e Pratique Data Science
    1. IPython
    2. Matemática
    3. Não Do Zero
      1. NumPy
      2. pandas
      3. scikit-learn
      4. Visualização
      5. R
    4. Encontre Dados
    5. Pratique Data Science
      1. Hacker News
      2. Carros de Bombeiros
      3. Camisetas
      4. E Você?
  32. Sobre o Autor
  33. Colophon

Product information

  • Title: Data Science do Zero
  • Author(s): Joel Grus
  • Release date: April 2016
  • Publisher(s): Alta Books
  • ISBN: 9788576089988