May 2024
Intermediate to advanced
181 pages
3h 9m
Chinese
决策树是数据在树状结构中的排列,根据节点处属性值的不同,数据将被分到不同的分支中。
本章将使用一个标准的ID3学习算法来构建一个决策树,该算法选择一个数据的属性,以最大化信息增益(一种基于信息熵的度量)为目标对数据样本进行分类。
本章将学习以下内容:
例如,人们可能会对何时游泳有一定的偏好。偏好结果记录在表3-1中:
表3-1
|
泳衣 |
水温 |
游泳偏好 |
|---|---|---|
|
None |
Cold |
No |
|
None |
Warm |
No |
|
Small |
Cold |
No |
|
Small |
Warm |
No |
|
Good |
Cold |
No |
|
Good |
Warm |
Yes |
这个表中的数据可以用图3-1所示的决策树分支表示。

图3-1
在根节点有这么一个问题:是否有泳衣?问题的答案将可用数据分成3组,每组有两行记录。如果属性“泳衣”为none,则属性“游泳偏好”为no。不需要进一步知道关于水温的偏好了,因为所有属性“泳衣”为none的样本将被分类为no。属性“泳衣”为“small”的情况也是如此。在“泳衣”为“合适”的情况下,剩下的两行记录可以分为两类:no和yes。 ...
Read now
Unlock full access