7章学習パイプライン

前処理の次のステージはモデルの学習です。学習プロセスでは、機械学習モデルが学習用データを読み込み、そのデータを使って重みの更新を行います(図7-1)。学習後、モデルはデプロイのために保存、エクスポートされます。

モデルの学習プロセスでは、モデルは前処理されたデータで学習を行い、デプロイ用にエクスポートされる。エクスポートされたモデルは、予測に使用される

図7-1 モデルの学習プロセスでは、モデルは前処理されたデータで学習を行い、デプロイ用にエクスポートされる。エクスポートされたモデルは、予測に使用される

本章では、学習用データ(および検証用データ)を効率的にモデルに取り込む方法を見ていきます。また、さまざまな計算デバイス(CPUやGPU)間のタイムスライシングを活用し、プロセス全体のレジリエンスと再現性を高める方法を説明します。

[Tip]

本章のコードは、本書のGitHubリポジトリの07_trainingフォルダを参照してください。コードサンプルやノートブックのファイル名は必要に応じて明記します。

7.1 効率的なデータの読み込み

機械学習モデルの学習では、データの取り込みに費やされる時間は小さなものではありません。学習パイプラインのこのステージを効率化して高速化できれば、より効率的な学習が可能になります。これには以下の方法があります。

データの効率的な保存
入力画像を可能な限り前処理し、前処理済みのデータを効率的に読み取れる形式で保存する ...

Get コンピュータビジョンのための実践機械学習 ―モデルアーキテクチャからMLOpsまで now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.