Statistiques pratiques pour les scientifiques des données, 2e édition.
by Peter Bruce, Andrew Bruce, Peter Gedeck
Overview
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Les méthodes statistiques sont un élément clé de la science des données, mais peu de scientifiques des données ont une formation formelle en statistique. Les cours et les livres sur les statistiques de base couvrent rarement le sujet du point de vue de la science des données. La deuxième édition de ce guide populaire ajoute des exemples complets en Python, fournit des conseils pratiques sur l'application des méthodes statistiques à la science des données, t'explique comment éviter leur mauvaise utilisation et te donne des conseils sur ce qui est important et ce qui ne l'est pas.
De nombreuses ressources sur la science des données intègrent des méthodes statistiques mais manquent d'une perspective statistique plus approfondie. Si tu es familier avec les langages de programmation R ou Python et que tu as une certaine exposition aux statistiques, cette référence rapide comble le fossé dans un format accessible et lisible.
Avec ce livre, tu apprendras :
- Pourquoi l'analyse exploratoire des données est une étape préliminaire essentielle de la science des données.
- Comment l'échantillonnage aléatoire peut réduire les biais et produire un ensemble de données de meilleure qualité, même avec les big data.
- Comment les principes de la conception expérimentale permettent d'obtenir des réponses définitives aux questions.
- Comment utiliser la régression pour estimer les résultats et détecter les anomalies.
- Techniques de classification clés pour prédire les catégories auxquelles un enregistrement appartient
- Méthodes d'apprentissage automatique statistique qui "apprennent" à partir des données.
- Méthodes d'apprentissage non supervisé pour extraire le sens des données non étiquetées.