Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
366
5
章 機械学習
1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
1., 1., 1., 1., 1., 1., 1.])
サンプル数は
150
なので、
leave-one-out
交差検証では
150
回の試行が行われます。結果は予測の
成功(
1.0
)または不成功(
0.0
)のいずれかを表し、この平均を取るとエラー率の推定値が得られます。
In[9]: scores.mean()
Out[9]: 0.95999999999999996
他の交差検証も同様に使用できます。
scikit-learn
で何が提供されているかは、
IPython
を使用し
sklearn.model_selection
サブモジュールを調べるか、
scikit-learn
の交差検証(
cross-validation
オンラインマニュアル(
http://scikit-learn.org/stable/modules/cross_validation.html
)を参照してく
ださい。
5.3.2
 最適なモデルの選択
検証の基礎と交差検証について学んだので、モデル選択とハイパーパラメータの選択についても
う少し詳しく説明します。この問題は、機械学習を実践する上で最も重要な課題ですが、入門的な ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other