
监督学习
|
59
print("Accuracy on training set: {:.3f}".format(tree.score(X_train, y_train)))
print("Accuracy on test set: {:.3f}".format(tree.score(X_test, y_test)))
Out[59]:
Accuracy on training set: 0.988
Accuracy on test set: 0.951
3.
分析决策树
我们可以利用 tree 模块的 export_graphviz 函数来将树可视化。这个函数会生成一
个
.dot
格式的文件,这是一种用于保存图形的文本文件格式。我们设置为结点添加颜色
的选项,颜色表示每个结点中的多数类别,同时传入类别名称和特征名称,这样可以对
树正确标记:
In[60]:
from sklearn.tree import export_graphviz
export_graphviz(tree, out_file="tree.dot", class_names=["malignant","benign"],
feature_names=cancer.feature_names, impurity=False, filled=True)
我们可以利用 graphviz 模块读取这个文件并将其可视化(你也可以使用任何能够读取
.dot
文件的程序),见图
2-27
:
In[61]:
import graphviz
with ...