September 2024
Intermediate to advanced
406 pages
9h 44m
Spanish
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Oh naturaleza, naturaleza, ¿por qué eres tan deshonesta como para enviar al mundo a los hombres con estas falsas recomendaciones?
Henry Fielding
Otro problema común de los datos es producir recomendaciones de algún tipo. Netflix recomienda películas que quizá quieras ver. Amazon recomienda productos que quizá quieras comprar. Twitter recomienda usuarios que quizá quieras seguir. En este capítulo, veremos varias formas de utilizar los datos para hacer recomendaciones.
En en particular, examinaremos el conjunto de datos de users_interests que hemos utilizado antes:
users_interests=[["Hadoop","Big Data","HBase","Java","Spark","Storm","Cassandra"],["NoSQL","MongoDB","Cassandra","HBase","Postgres"],["Python","scikit-learn","scipy","numpy","statsmodels","pandas"],["R","Python","statistics","regression","probability"],["machine learning","regression","decision trees","libsvm"],["Python","R","Java","C++","Haskell","programming languages"],["statistics","probability","mathematics","theory"],["machine learning","scikit-learn","Mahout","neural networks"],["neural networks","deep learning","Big Data","artificial intelligence"],["Hadoop","Java","MapReduce","Big Data"],["statistics","R","statsmodels"],["C++","deep learning","artificial intelligence","probability"],["pandas",