Capítulo 14. Regresión lineal simple

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

El arte, como la moral, consiste en trazar la línea en algún lugar.

G. K. Chesterton

En el Capítulo 5, utilizamos la función correlation para medir la fuerza de la relación lineal entre dos variables. Para la mayoría de las aplicaciones, saber que existe esa relación lineal no es suficiente. Querremos comprender la naturaleza de la relación. Aquí es donde utilizaremos la regresión lineal simple.

El modelo

Recuerda que estábamos investigando la relación entre el número de amigos de un usuario de DataSciencester y la cantidad de tiempo que pasa en el sitio cada día. Supongamos que te has convencido de que tener más amigos hace que la gente pase más tiempo en el sitio, en lugar de una de las explicaciones alternativas que hemos discutido.

El vicepresidente de compromiso te pide que construyas un modelo que describa esta relación. Como has encontrado una relación lineal bastante fuerte, un lugar natural para empezar es un modelo lineal.

En concreto, planteas la hipótesis de que existen constantes α (alfa) y β (beta) tales que:

y i = β x i + α + ε i

donde y i es el número de minutos diarios que el usuario i pasa en el sitio, x i es el número de amigos que tiene el usuario i, y ε es un término de error (esperemos que pequeño) que representa el hecho de que hay otros factores que no se tienen en cuenta en este sencillo ...

Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.