第9章 推荐系统
大多数在线购物者都可能熟悉亚马逊的推荐系统,如图9-1所示。
图9-1 Amazon.com的推荐
当消费者浏览商品项目时,网站展示出一些销量很高的类似项目。这些项目来自访问令人惊叹的亚马逊产品、消费者和销售数据库的推荐系统。
现在,许多商品和服务的提供商运行着在线推荐系统。Netflix推荐电影,苹果推荐音乐,Audible推荐图书,Yelp推荐餐馆等。
推荐系统(recommender system)是一种算法,它的分析基于消费者之前的选择与许多其他消费者的比较,预测该消费者的产品偏好。这些算法由亚马逊和Netflix开创,现在已在网络上普及。
聚类算法提供了建立推荐系统的一种机制:推荐同一个聚类中的其他数据点。具体地说,我们可以使用k-均值算法,然后推荐聚类的均值。聚类算法和分类算法都可以类似这样使用,从而实现推荐系统。但是,本章将考察几种专门为推荐系统设计的算法。
9.1 效用矩阵
大多数推荐系统使用的是用户项目偏好的量化输入。这些偏好通常排列在一个矩阵中,矩阵的一行表示每位用户,一列表示每个项目。这样的矩阵叫作效用矩阵(utility matrix)。例如,Netflix请求它的用户按一星到五星对电影进行评分。所以,这个效用矩阵中的每一项会是一个范围0~5的整数uij,代表了用户i对电影j的评分星数,其中0代表没有评分。
例如,表9-1展示了一个用户在1~5范围内对啤酒进行评分的效用矩阵,5表示最大的认可。空白表示没有用户对该项目评分。啤酒是:BL = ...
Get Java数据分析指南 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.