
614
附录 A
课后练习题解答
有关代码练习的解答,请参见
https://github.com/ageron/handson-ml2
上的在
线 Jupyter notebook。
第 1 章:机器学习概览
1. 机器学习是关于构建可以从数据中学习的系统。学习意味着在一定的性能指标下,
在某些任务上会变得越来越好。
2. 机器学习非常适合没有算法解答的复杂问题,它可以替代一系列需要手动调整的规
则,来构建适应不断变化的环境的系统并最终帮助人类(例如,数据挖掘)。
3. 带标签的训练集是一个包含每个实例所需解决方案(也称为标签)的训练集。
4. 两个最常见的有监督任务是回归和分类。
5. 常见的无监督任务包括聚类、可视化、降维和关联规则学习。
6. 如果我们想要机器人在各种未知的地形中学习行走,则强化学习可能会表现最好,
因为这通常是强化学习要解决的典型问题。也可以将强化学习问题表示为有监督学
习或半监督学习问题,但这种情况不是很自然的想法。
7. 如果你不知道如何定义组,则可以使用聚类算法(无监督学习)将客户划分为相似
客户集群。但是,如果你知道你想要拥有哪些组,那么可以将每个组的许多实例提
供给分类算法(有监督学习),并将所有客户分类到这些组中。
8. 垃圾邮件检测是一个典型的有监督学习问题:向该算法提供许多电子邮件及其标签
(垃圾邮件或非垃圾邮件)。
9. 与批量学习系统相反,在线学习系统能够进行增量学习。这使得它能够快速适应不