
机器学习概览
|
23
最后,还有一个常见的无监督任务是关联规则学习,其目的是挖掘大量数据,发现属性
之间的有趣联系。例如,假设你开了一家超市,在销售日志上运行关联规则之后发现买
烧烤酱和薯片的人也倾向于购买牛排。那么,你可能会将这几样商品摆放得更近一些。
半监督学习
由于通常给数据做标记是非常耗时和昂贵的,你往往会有很多未标记的数据而很少有已
标记的数据。有些算法可以处理部分已标记的数据。这被称为半监督学习(见图 1-11)。
特征 2
特征 1
类
?
图 1-11 :半监督学习有两个类别(三角形和正方形):未标记的示例(圆形)有助于将新实例
(十字)分类为三角形类别而不是正方形类别,即使它更接近于标记的正方形
有些照片托管服务(例如 Google 相册)就是很好的示例。一旦你将所有的家庭照片上传
到服务器后,它会自动识别出人物 A 出现在照片 1、5 和 11 中,人物 B 出现在照片 2、
5 和 7 中。这是算法的无监督部分(聚类)。现在系统需要你做的只是告诉它这些人都是
谁。给每个人一个标签之后
注 4
,它就可以给每张照片中的每个人命名,这对于搜索图片
非常重要。
1
大多数半监督学习算法是无监督算法和有监督算法的结合。例如,深度信念网络(DBN)
基于一种互相堆叠的无监督组件,这个组件叫作受限玻尔兹曼机(RBM)。受限玻尔兹
曼机以无监督方式进行训练,然后使用有监督学习技术对整个系统进行微调。
强化学习
强化学习则是一个非常与众不同的“巨兽”。它的学习系统(在其语境中称为智能体)
能够观察环境,做出选择,执行动作,并获得回报( ...