Capítulo 23. Sistemas de recomendación

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Oh naturaleza, naturaleza, ¿por qué eres tan deshonesta como para enviar al mundo a los hombres con estas falsas recomendaciones?

Henry Fielding

Otro problema común de los datos es producir recomendaciones de algún tipo. Netflix recomienda películas que quizá quieras ver. Amazon recomienda productos que quizá quieras comprar. Twitter recomienda usuarios que quizá quieras seguir. En este capítulo, veremos varias formas de utilizar los datos para hacer recomendaciones.

En en particular, examinaremos el conjunto de datos de users_interests que hemos utilizado antes:

users_interests = [
    ["Hadoop", "Big Data", "HBase", "Java", "Spark", "Storm", "Cassandra"],
    ["NoSQL", "MongoDB", "Cassandra", "HBase", "Postgres"],
    ["Python", "scikit-learn", "scipy", "numpy", "statsmodels", "pandas"],
    ["R", "Python", "statistics", "regression", "probability"],
    ["machine learning", "regression", "decision trees", "libsvm"],
    ["Python", "R", "Java", "C++", "Haskell", "programming languages"],
    ["statistics", "probability", "mathematics", "theory"],
    ["machine learning", "scikit-learn", "Mahout", "neural networks"],
    ["neural networks", "deep learning", "Big Data", "artificial intelligence"],
    ["Hadoop", "Java", "MapReduce", "Big Data"],
    ["statistics", "R", "statsmodels"],
    ["C++", "deep learning", "artificial intelligence", "probability"],
    ["pandas", 

Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.