Skip to Content
Ciencia de datos desde cero, 2ª edición
book

Ciencia de datos desde cero, 2ª edición

by Joel Grus
September 2024
Intermediate to advanced
406 pages
9h 44m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Ciencia de datos desde cero, 2ª edición

Capítulo 15. Regresión múltiple

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

No miro un problema y meto variables que no le afectan.

Bill Parcells

Aunque, la vicepresidenta, está bastante impresionada con tu modelo predictivo, cree que puedes hacerlo mejor. Para ello, has recopilado datos adicionales: sabes cuántas horas trabaja cada uno de tus usuarios al día, y si tienen un doctorado. Te gustaría utilizar estos datos adicionales para mejorar tu modelo.

En consecuencia, planteas la hipótesis de un modelo lineal con más variables independientes:

minutos = α + β 1 amigos + β 2 trabajo horas + β 3 phd + ε

Obviamente, el hecho de que un usuario tenga un doctorado no es un número, pero, como mencionamos en el Capítulo 11, podemos introducir una variable ficticia que sea igual a 1 para los usuarios con doctorado y a 0 para los usuarios sin doctorado, después de lo cual es tan numérica como las demás variables.

El modelo

Recuerda que en el capítulo 14 ajustamos un modelo de la forma

y i = α + β x i + ε i

Imagina ahora que cada entrada x i no es un único número, sino un vector de k números, x i1 , ... , x ik . El modelo de regresión múltiple supone que

y i = α + β 1 x i1 + . . . + β k x ik + ε i

En regresión múltiple, el vector de parámetros suele denominarse β. Querremos que incluya también el término constante, lo que podemos conseguir añadiendo una columna de 1s a nuestros ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Ciencia de datos en AWS

Ciencia de datos en AWS

Chris Fregly, Antje Barth

Publisher Resources

ISBN: 9781098182625