Skip to Content
Statistiques pratiques pour les scientifiques des données, 2e édition.
book

Statistiques pratiques pour les scientifiques des données, 2e édition.

by Peter Bruce, Andrew Bruce, Peter Gedeck
November 2024
Intermediate to advanced
368 pages
10h 21m
French
O'Reilly Media, Inc.
Book available
Content preview from Statistiques pratiques pour les scientifiques des données, 2e édition.

Chapitre 2. Données et distributions d'échantillonnage

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Une idée reçue veut que l'ère du big data signifie la fin d'un besoin d'échantillonnage.En fait, la prolifération de données de qualité et de pertinence variables renforce le besoin d'échantillonnage en tant qu'outil permettant de travailler efficacement avec une variété de données et de minimiser les biais. Même dans le cadre d'un projet big data, les modèles prédictifs sont généralement développés et pilotés avec des échantillons.Les échantillons sont également utilisés dans des tests de différentes sortes (par exemple, pour comparer l'effet de la conception des pages web sur les clics).

Lafigure 2-1 présente un schéma qui sous-tend les concepts que nous aborderons dans ce chapitre, à savoir les données et les distributions d'échantillonnage. Le côté gauche représente une population qui, en statistique, est supposée suivre une distribution sous-jacente mais inconnue. Tout ce dont nous disposons, ce sont les données de l 'échantillon et leur distribution empirique, représentées sur le côté droit. Pour passer du côté gauche au côté droit, on utilise une procédure d'échantillonnage (représentée par une flèche). Les statistiques traditionnelles se concentraient beaucoup sur le côté gauche, en utilisant une théorie basée sur des hypothèses fortes concernant la population. Les statistiques modernes ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Ingénierie logicielle pour les scientifiques des données

Ingénierie logicielle pour les scientifiques des données

Catherine Nelson
Reshaping Intelligent Business and Industry

Reshaping Intelligent Business and Industry

Surjeet Dalal, Neeraj Dahiya, Vivek Jaglan, Deepika Koundal, Dac-Nhuong Le
Applications of Computational Intelligence in Multi-Disciplinary Research

Applications of Computational Intelligence in Multi-Disciplinary Research

Ahmed A. Elngar, Rajdeep Chowdhury, Mohamed Elhoseny, Valentina Emilia Balas

Publisher Resources

ISBN: 9798341614185Supplemental Content