Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
372
5
章 機械学習
図5-29 交差検証により求めた図5-27 のデータに対する最適モデル
最適モデルを見つけるために訓練スコアを計算する必要は実際にはありませんが、訓練スコアと
検証スコアの関係を調べることで、モデルのパフォーマンスについてのわかりやすい洞察が得られ
ます。
5.3.3
 学習曲線
モデルの複雑さに関する重要な側面の
1
つとして、最適なモデルは一般的に学習データの量に依
存します。例えば、ポイントを
5
倍にして新しいデータセットを生成してみましょう( 5-30)。
In[15]: X2, y2 = make_data(200)
plt.scatter(X2.ravel(), y2);
図5-30 学習曲線デモ用のデータ
5.3
 ハイパーパラメータとモデルの検証
373
前のコードをコピーして、この大きなデータセットの検証曲線をプロットします。参照のために
前の結果に上書きしてみましょう( 5-31)。
In[16]:
degree = np.arange(21)
train_score2, val_score2 = validation_curve(PolynomialRegression(), X2, y2,
'polynomialfeatures__degree',
degree, cv=7) ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other