Statistiques pratiques pour les scientifiques des données, 2e édition.
by Peter Bruce, Andrew Bruce, Peter Gedeck
Chapitre 4. Régression et prédiction
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
L'objectif le plus courant en matière de statistiques est peut-être de répondre à la question "La variable X (ou plus vraisemblablement, ) associée à une variable Y, et si oui, quelle est la relation et pouvons-nous l'utiliser pour prédire Y?"
Le lien entre les statistiques et la science des données n'est nulle part aussi fort que dans le domaine de la prédiction - plus précisément, la prédiction d'une variable de résultat (cible) basée sur les valeurs d'autres variables "prédictives". Ce processus de formation d'un modèle sur des données dont le résultat est connu, en vue d'une application ultérieure à des données dont le résultat n'est pas connu, est appelé apprentissage supervisé. Un autre lien important entre la science des données et les statistiques se trouve dans le domaine de la détection des anomalies, où les diagnostics de régression initialement prévus pour l'analyse des données et l'amélioration du modèle de régression peuvent être utilisés pour détecter des enregistrements inhabituels.
Régression linéaire simple
La régression linéaire simple fournit un modèle de la relation entre l'ampleur d'une variable et celle d'une seconde - par exemple, lorsque X augmente, Y augmente également.Ou lorsque X augmente, Y diminue.1 La corrélation est une autre façon de mesurer la relation entre ...