Skip to Content
Ciencia de datos desde cero, 2ª edición
book

Ciencia de datos desde cero, 2ª edición

by Joel Grus
September 2024
Intermediate to advanced
406 pages
9h 44m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Ciencia de datos desde cero, 2ª edición

Capítulo 13. Bayes ingenuos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Es bueno que el corazón sea ingenuo y que la mente no lo sea.

Anatole France

Una red social no sirve de mucho si la gente no puede establecer contactos. En consecuencia, DataSciencester tiene una función muy popular que permite a los miembros enviar mensajes a otros miembros. Y aunque la mayoría de los miembros son ciudadanos responsables que sólo envían mensajes bien recibidos del tipo "¿qué tal?", unos pocos malhechores envían spam persistentemente a otros miembros sobre planes para hacerse rico, productos farmacéuticos que no requieren receta médica y programas de obtención de credenciales en ciencia de datos con ánimo de lucro. Tus usuarios han empezado a quejarse, por lo que el vicepresidente de mensajería te ha pedido que utilices la ciencia de datos para encontrar una forma de filtrar estos mensajes de spam.

Un filtro de spam realmente tonto

Imagina un "universo" que consiste en recibir un mensaje elegido al azar entre todos los posibles. Sea S el suceso "el mensaje es spam" y B el suceso "el mensaje contiene la palabra bitcoin". El teorema de Bayes nos dice que la probabilidad de que el mensaje sea spam condicionada a que contenga la palabra bitcoin es:

P ( S | B ) = [ P ( B | S ) P ( S ) ] / [ P ( B | S ) P ( S ) + P ( B | ¬ S ) P ( ¬ S ) ]

El numerador es la probabilidad de que un mensaje sea spam y contenga bitcoin ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Ciencia de datos en AWS

Ciencia de datos en AWS

Chris Fregly, Antje Barth

Publisher Resources

ISBN: 9781098182625