11章モデルの評価

レシピ11.0 はじめに

 本章では、学習アルゴリズムで作られるモデルの質を評価する戦略を見ていく。モデルを作る方法を説明する前に、モデルの評価方法を説明するのはおかしいと思うかもしれないが、これにはそれなりの理由があるのだ。モデルの有効性は、そのモデルによる予測の質に依存する。我々の目標はモデルを作ること(こちらは簡単)ではなく、高性能なモデルを作ること(こちらは難しい)なのだ。このため、多数ある学習アルゴリズムを説明する前に、それらアルゴリズムの生み出すモデルの質を評価する方法を準備しておく。

レシピ11.1 交差検証

問題

クラス分類モデルの、未見データに対する汎化性能を評価したい。

解決策

 データを前処理し、モデルを訓練し、交差検証で評価するパイプラインを作る。

# ライブラリをロード from sklearn import datasets from sklearn import metrics from sklearn.model_selection import KFold, cross_val_score from sklearn.pipeline import make_pipeline from sklearn.linear_model import LogisticRegression from sklearn.preprocessing import StandardScaler # 数字データセットをロード digits = datasets.load_digits() # 特徴量行列を作成 features = digits.data # ターゲットベクトルを作成 target = digits.target # 標準化器を作成 ...

Get Python機械学習クックブック 第2版 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.