
18
|
第
1
章
网络(见第 10 章),从而输出客户最可能购买的产品。这个神经网络是在所有客户
的购买记录上训练的。
为游戏建造智能机器人
这通常通过强化学习(RL,见第 18 章)来解决。强化学习是机器学习的一个分
支,在一个给定的环境(例如游戏)中,训练代理(例如机器人)选择在一段时
间内将它们的奖励最大化的行动(例如,机器人可能会在玩家每次失去一些生命
值时获得奖励)。在围棋比赛中打败世界冠军的著名 AlphaGo 程序就是使用 RL 构
建的。
这个列表可以一直延伸下去,但希望它能让你了解机器学习所能处理的任务的广度和复
杂性,以及你在每个任务中会用到的技术类型。
1.4 机器学习系统的类型
现有的机器学习系统类型繁多,为便于理解,我们根据以下标准将它们进行大的分类:
•
是否在人类监督下训练(有监督学习、无监督学习、半监督学习和强化学习)。
•
是否可以动态地进行增量学习(在线学习和批量学习)。
•
是简单地将新的数据点和已知的数据点进行匹配,还是像科学家那样,对训练数据
进行模式检测然后建立一个预测模型(基于实例的学习和基于模型的学习)。
这些标准之间互相并不排斥,你可以以你喜欢的方式将其任意组合。例如,现在最先进
的垃圾邮件过滤器可能是使用深度神经网络模型对垃圾邮件和常规邮件进行训练,完成
动态学习。这使其成为一个在线的、基于模型的有监督学习系统。
我们来看看这几个标准。
1.4.1 有监督学习和无监督学习
根据训练期间接受的监督数量和监督类型,可以将机器学习系统分为以下四个主要类
别:有监督学习、无监督学习、半监督学习和强化学习。 ...