Overview
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
I metodi statistici sono una parte fondamentale della scienza dei dati, ma pochi scienziati dei dati hanno una formazione statistica formale. I corsi e i libri sulla statistica di base raramente trattano l'argomento dal punto di vista della scienza dei dati. La seconda edizione di questa popolare guida aggiunge esempi completi in Python, fornisce una guida pratica sull'applicazione dei metodi statistici alla scienza dei dati, spiega come evitarne l'uso improprio e offre consigli su ciò che è importante e ciò che non lo è.
Molte risorse di scienza dei dati includono metodi statistici, ma non hanno una prospettiva statistica più approfondita. Se conosci i linguaggi di programmazione R o Python e hai un po' di esperienza con la statistica, questa guida veloce ti aiuta a colmare le lacune in un formato facile da capire e da leggere.
Con questo libro imparerai:
- Perché l'analisi esplorativa dei dati è un passo preliminare fondamentale nella scienza dei dati
- Come il campionamento casuale può ridurre i pregiudizi e produrre un set di dati di qualità superiore, anche con i big data
- Come i principi della progettazione sperimentale forniscono risposte definitive alle domande
- Come usare la regressione per stimare i risultati e individuare le anomalie
- Le tecniche di classificazione chiave per prevedere a quale categoria appartiene un record
- Metodi statistici di apprendimento automatico che "imparano" dai dati
- Metodi di apprendimento non supervisionato per estrarre significato da dati non etichettati