3章自動化された機械学習(AutoML)

 本章では、AIや機械学習のパイプラインのために独自のインフラを管理する必要がないように、フルマネージドのAmazonのAIおよび機械学習サービスを使用する方法を紹介します。ここでは、自動化された機械学習のための2つのAmazonサービス、Amazon SageMaker AutopilotとAmazon Comprehendを深く掘り下げます。SageMaker AutopilotとComprehendを使用することで、非常に少ない労力とコストでモデルのベースライン性能を確立することができます。

 機械学習の実践者は通常、モデルの構築、訓練、チューニングに数週間から数ヶ月を費やすものです。データを準備し、使用するフレームワークやアルゴリズムを決定します。反復プロセスの中で、データセットや問題の種類に応じて、最適なアルゴリズムを選択しようとします。残念ながら、このプロセスに役立つチートシートはありません。多くの実験を行い、アルゴリズムとデータセットに最適なハイパーパラメータを見つけるには、経験、直感、そして忍耐が必要です。熟練したデータサイエンティストは、長年の経験と直感をもとに、与えられたデータセットや問題の種類に応じて最適なアルゴリズムを選択しますが、実際に訓練を行い、モデルの検証を繰り返すことで、直感を検証しなくてはいけません。

 もし、ワンクリックで、データセットに最適なアルゴリズムを選択し、モデルの訓練とチューニングを行い、モデルを本番環境にデプロイするサービスを利用できたらどうでしょうか? Amazon SageMaker Autopilotは、モデルの訓練とチューニングのプロセスを簡素化し、モデル開発ライフサイクル全体を高速化します。特徴量選択やハイパーパラメータチューニング(HPT)などの定型的なライフサイクルフェーズに費やす時間を減らすことで、ドメイン固有の問題により多くの時間を費やすことができます。 ...

Get 実践 AWSデータサイエンス ―エンドツーエンドのMLOpsパイプライン実装 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.