September 2021
Intermediate to advanced
392 pages
6h 8m
Japanese
1章から14章で、機械学習パイプラインの現状を把握し、その構築方法に関する推奨事項を示しました。機械学習パイプラインは比較的新しい概念であり、今後ますます発展していく分野です。本章では、重要ではあるが、現在のパイプラインにはあまり合わないと思われる事柄を取り上げ、機械学習パイプラインの今後のステップについて考察します。
本書を通して、モデルは実験済みであり、アーキテクチャはすでに決定されていることを前提としてきました。ここでは、実験を追跡し、スムーズに行う方法について、見解を共有します。実験中は、モデルアーキテクチャ、ハイパーパラメータ、特徴集合を探索するかもしれません。何を探索するにしても、実験のプロセスが本番リリースを行うプロセスと密接に結びつけられている必要があるということが重要なポイントです。
モデルを最適化するプロセスは手動・自動にかかわらず、結果をキャプチャして共有することが不可欠です。共有することで、チームメンバーは、モデル更新の進捗状況を速やかに評価できます。同時に、モデルの作成者は、自動的に作成された実験追跡を得られます。優れた実験追跡は、データサイエンスチームの効率化に役立ちます。
実験追跡は、モデルの監査証跡にも追加され、訴訟リスクに対する保護手段となる可能性があります。たとえば、データサイエンスチームが、「モデルの学習中にエッジケースが考慮されたかどうか」という質問をされたとしましょう。実験追跡をしていれば、モデルのパラメータとイテレーションを追跡するのに役立ちます。
実験追跡用のツールには、Weights and Biases(https://www.wandb.com)やSacred( ...
Read now
Unlock full access