7章モデル分析と検証
これまでに、データに関する統計量の確認や正しい特徴への変換、モデルの学習をしてきました。いよいよモデルを本番環境にデプロイする時が来たのでしょうか。私見ですが、モデルをデプロイする前に、モデルの性能を詳細に分析し、本番環境へデプロイ済みのモデルより性能が改善されているか確認するステップが必要だと考えています。図7-1に、パイプラインにおけるこれらのステップの立ち位置を示します。
モデルの学習中は、評価セットを使って性能を計測し、さまざまなハイパーパラメータを試して最高性能を引き出そうとします。ただ、学習中に使用する指標は1つだけのことが多く、正解率を使うのが常です。
機械学習パイプラインを構築する際には、複雑なビジネス上の質問に答えようとしたり、複雑な実世界のシステムをモデル化しようとしたりすることがよくあります。モデルがその質問に答えられるかどうかを判断するには、1つの指標だけでは十分でないことがよくあります。これは、データセットが不均衡であったり、モデルの予測による影響がグループ間で偏っている場合、とくに当てはまります。
加えて、指標1つで評価セット全体の平均的な性能を表すため、重要な詳細を覆い隠してしまうことがあります。たとえば、モデルが人々に関するデータを扱っている場合、次のようなことを気にしたほうがよいはずです。
- モデルとやり取りするすべての人が同じ体験を得られるか
- 男性ユーザーより女性ユーザーに対する性能のほうが良くないか ...
Get 入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.