Capítulo 23. Sistemas de recomendación
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Oh naturaleza, naturaleza, ¿por qué eres tan deshonesta como para enviar al mundo a los hombres con estas falsas recomendaciones?
Henry Fielding
Otro problema común de los datos es producir recomendaciones de algún tipo. Netflix recomienda películas que quizá quieras ver. Amazon recomienda productos que quizá quieras comprar. Twitter recomienda usuarios que quizá quieras seguir. En este capítulo, veremos varias formas de utilizar los datos para hacer recomendaciones.
En en particular, examinaremos el conjunto de datos de users_interests
que hemos utilizado antes:
users_interests
=
[
[
"Hadoop"
,
"Big Data"
,
"HBase"
,
"Java"
,
"Spark"
,
"Storm"
,
"Cassandra"
],
[
"NoSQL"
,
"MongoDB"
,
"Cassandra"
,
"HBase"
,
"Postgres"
],
[
"Python"
,
"scikit-learn"
,
"scipy"
,
"numpy"
,
"statsmodels"
,
"pandas"
],
[
"R"
,
"Python"
,
"statistics"
,
"regression"
,
"probability"
],
[
"machine learning"
,
"regression"
,
"decision trees"
,
"libsvm"
],
[
"Python"
,
"R"
,
"Java"
,
"C++"
,
"Haskell"
,
"programming languages"
],
[
"statistics"
,
"probability"
,
"mathematics"
,
"theory"
],
[
"machine learning"
,
"scikit-learn"
,
"Mahout"
,
"neural networks"
],
[
"neural networks"
,
"deep learning"
,
"Big Data"
,
"artificial intelligence"
],
[
"Hadoop"
,
"Java"
,
"MapReduce"
,
"Big Data"
],
[
"statistics"
,
"R"
,
"statsmodels"
],
[
"C++"
,
"deep learning"
,
"artificial intelligence"
,
"probability"
],
[
"pandas"
,
Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.