
5.8
詳細:決定木とランダムフォレスト
433
9 0.96 0.98 0.97 46
avg / total 0.98 0.98 0.98 450
そして、どの程度正しいのかを混合行列を使って測ります(図 5-79)。
In[16]: from sklearn.metrics import confusion_matrix
mat = confusion_matrix(ytest, ypred)
sns.heatmap(mat.T, square=True, annot=True, fmt='d', cbar=False, cmap='RdPu')
plt.xlabel('true label')
plt.ylabel('predicte
d label');
真のラベル
図5-79 ランダムフォレストによる文字認識の混合行列
特に調整を行っていない単純なランダムフォレストでも、文字が非常に正確に分類できることが
わかります。
5.8.5
ランダムフォレストまとめ
この節では、アンサンブルの概念、特にランダムな決定木のアンサンブルであるランダムフォレ
ストモデルについて簡単に紹介しました。ランダムフォレストは、いくつかの利点を持つ強力な手
法です。
●
基礎となる決定木の単純さにより、学習と予測の両方が非常に高速に動作します。さらに、
個々の決定木が完全に独立した存在なので、それぞれのタスクの並列化が容易です。
●
複数の決定木による確率的な分類が可能です。推定器ごとの確率(
scikit-learn
では ...