Estadística Práctica para Científicos de Datos, 2ª Edición
by Peter Bruce, Andrew Bruce, Peter Gedeck
Capítulo 4. Regresión y predicción
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Quizá el objetivo más común en estadística sea responder a la pregunta "¿Es la variable X (o más probablemente, ) asociada a una variable Y y, en caso afirmativo, ¿cuál es la relación y podemos utilizarla para predecir Y?".
En ninguna parte es más fuerte el nexo entre la estadística y la ciencia de datos que en el ámbito de la predicción: concretamente, la predicción de una variable de resultado (objetivo) basada en los valores de otras variables "predictoras". Este proceso de entrenamiento de un modelo sobre datos en los que se conoce el resultado, para su posterior aplicación a datos en los que no se conoce el resultado, se denomina aprendizaje supervisado. Otra conexión importante entre la ciencia de los datos y la estadística se da en el ámbito de la detección de anomalías, en el que los diagnósticos de regresión destinados originalmente al análisis de datos y la mejora del modelo de regresión pueden utilizarse para detectar registros inusuales.
Regresión lineal simple
La regresión lineal simple proporciona un modelo de la relación entre la magnitud de una variable y la de una segunda; por ejemplo, a medida que X aumenta, Y también aumenta.O a medida que X aumenta, Y disminuye.1 La correlación es otra forma de medir cómo se relacionan dos variables -ver el apartado "Correlación"-. La diferencia es que ...