Skip to Content
Ciencia de datos desde cero, 2ª edición
book

Ciencia de datos desde cero, 2ª edición

by Joel Grus
September 2024
Intermediate to advanced
406 pages
9h 44m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Ciencia de datos desde cero, 2ª edición

Capítulo 16. Regresión logística

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Mucha gente dice que hay una delgada línea entre la genialidad y la locura. Yo no creo que haya una línea muy fina, en realidad creo que hay un abismo enorme.

Bill Bailey

En el Capítulo 1, examinamos brevemente en el problema de intentar predecir qué usuarios de DataSciencester pagaban por las cuentas premium. Aquí volveremos sobre ese problema.

El problema

En tenemos un conjunto de datos anonimizados de unos 200 usuarios, que contiene el salario de cada usuario, sus años de experiencia como científico de datos y si pagó por una cuenta premium(Figura 16-1). Como es típico con las variables categóricas, representamos la variable dependiente como 0 (sin cuenta premium) o 1 (cuenta premium).

Como de costumbre, nuestros datos son una lista de filas[experience, salary, paid_account]. Vamos a convertirla al formato que necesitamos:

xs = [[1.0] + row[:2] for row in data]  # [1, experience, salary]
ys = [row[2] for row in data]           # paid_account

Un primer intento obvio es utilizar la regresión lineal y encontrar el mejor modelo:

pagado cuenta = β 0 + β 1 experiencia + β 2 salario + ε
Paid and Unpaid Users.
Figura 16-1. Usuarios de pago y no de pago

Y, ciertamente, nada nos impide modelizar el problema de esta forma. Los resultados se muestran en la Figura ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Ciencia de datos en AWS

Ciencia de datos en AWS

Chris Fregly, Antje Barth

Publisher Resources

ISBN: 9781098182625