Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
362
5
章 機械学習
5.2.4
 まとめ
この節では、
scikit-learn
データ表現と推定器
API
の重要な機能について説明しました。推定器の
種類に関係なく、同じインポート
/
インスタンス化
/
当てはめ
/
予測のパターンが使えます。推定
API
に関するこの知識があれば、
scikit-learn
のドキュメントを参照しながら、さまざまなモデル
を試すことができます。
次の節では、機械学習におけるおそらく最も重要なトピック、つまりモデルの選択と検証の方法
について検討します。
5.3
 ハイパーパラメータとモデルの検証
前の節では、教師あり機械学習モデルを適用するための基本的な手順を学びました。
1.
モデルのクラスを選択する
2.
モデルのハイパーパラメータを選択する
3.
モデルに学習用データを当てはめる
4.
モデルを使って新しいデータのラベルを予測する
最初の
2
つは、モデルの選択とハイパーパラメータの選択であり、機械学習の機能を効果的に
使
用する上で最も重要な部分です。選択を適切に行うには、データに対してモデルとハイパーパラ
メータが適していることを検証する方法が必要です。単純に聞こえるかもしれませんが、効果的に
行うためには避けなければならない落とし穴があります。
5.3.1
 モデル検証に関する考察
原理上、モデルの検証は非常に簡単です。モデルとそのハイパーパラメータを選択した後、その
モデルをいくつかの学習用データに適用し、その予測値を真の値と比較することによって、その効
果を測定できます。
次の節では、ホールドアウト検証や交差検証を使用する前に単純なアプローチを試し、それがな ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other