Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
5.8
 詳細:決定木とランダムフォレスト
427
いくつかの場所(例えば、
4
つの隅)では、
2
つの決定木は同じ結果を示していますが、他の場所
(例えば、任意の
2
つの集団の中間の領域)では、まったく異なる結果となっているのは見た目に明
らかです。重要な点は、分類が曖昧な場合にこうした不一致が発生する傾向があるため、両方の決
定木の情報を使用すればより良い結果が得られる可能性があるということです。
Jupyter notebook
を使っているのなら、データのランダムなサブセットで学習を行った決定木の
結果を、対話的に表示できます( 5-73)。
In[7]: # helpers_05_08 is found in the online appendix helpers_05_08
はオンラインの
Appendix
に掲載している
# (https://github.com/jakevdp/PythonDataScienceHandbook)
import helpers_05_08
helpers_05_08.randomized_tree_interactive(X, y)
図5-73 対話的な決定木可視化の最初の表示。フルバージョンについては、オンラインのAppendix を参照
2
つの決定木の情報を使って結果を向上させられるのであれば、多くの決定木の情報を使用する
と結果がさらに改善できることが予想できます。
5.8.2
 推定器の組み合わせ:ランダムフォレスト
過剰適合の影響を減らすために、複数の過
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other