book

マシンラーニング本番システム

by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu

March 2025

Beginner to intermediate

474 pages

7h 11m

Japanese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

この本を読むべき人この本を書いた理由本書のナビゲーション本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞ロバートハンネスエミリーディ
生産機械学習とは何か？機械学習パイプラインの利点既存モデルの維持ではなく、新モデルの開発に注力するバグを防ぐデバッグと結果再現のためのレコードの作成標準化MLパイプラインのビジネスケース機械学習パイプラインはいつ使うべきか？機械学習パイプラインのステップデータの取り込みとデータのバージョニングデータ検証フィーチャー・エンジニアリングモデルのトレーニングとチューニングモデル分析モデルのデプロイ前途を展望する
データ収集における重要な考慮事項責任あるデータ収集データのラベリングプロダクションMLにおけるデータの変化とドリフトラベリングデータ：ディレクトリ・ラベリングとヒト・ラベリングデータを検証する：データの問題を検出するデータを検証するTensorFlowのデータ検証TFDVによるスキュー検出スキューの種類例TensorFlowデータ検証で不均衡なデータセットを見つける結論
フィーチャー・エンジニアリング入門前処理演算子フィーチャーエンジニアリングのテクニックノーマライゼーションとスタンダード化バケット化フィーチャー・クロス次元と埋め込み視覚化スケールでの特徴変換拡張性の高いフレームワークを選ぶトレーニング・サービスの偏りを避けるインスタンスレベルとフルパス変換を比較するTensorFlow変換を使うアナライザーコード例フィーチャー・セレクションフィーチャー・スペースフィーチャー・セレクションの概要フィルタリング・メソッドラッパー・メソッド組み込みメソッドLLMとGenAIのための特徴と例の選択例TF変換を使ってテキストをトークン化するTFトランスフォームを使う利点 TFトランスフォームに代わるもの結論
データの旅MLメタデータスキーマを使うスキーマ開発スキーマ環境データセット間の変化エンタープライズ・データ・ストレージ特集店舗データウェアハウスデータレイク結論
高度なラベリング半教師付きラベリングアクティブ・ラーニング監督不行き届き高度なラベリング・レビューデータ補強例CIFAR-10その他の増強テクニックデータ補強の見直し時系列データの前処理：例ウィンドウサンプリング結論
次元削減：性能に対する次元の効果例Kerasを使った単語の埋め込み次元の呪いディメンジョンを追加すると、フィーチャースペースのボリュームが増える次元削減量子化とプルーニングモバイル、IoT、エッジ、および類似のユースケース量子化TF LiteでTensorFlowモデルを最適化する最適化オプション剪定知識の蒸留教師と生徒のネットワーク知識の蒸留テクニックTMKD：Q&Aタスクのために知識を抽出するEfficientNetsを蒸留することで堅牢性を高める結論
分散トレーニングデータ並列性効率的な入力パイプライン入力パイプラインの基本入力パイプラインのパターン：効率の向上TensorFlowデータで入力パイプラインを最適化する大規模モデルのトレーニング巨大ニューラルネットと並列性の台頭可能性のある解決策とその欠点パイプラインの並列処理に救いはあるか？結論
モデルのパフォーマンスを分析するブラックボックス評価パフォーマンス・メトリクスと最適化オブジェクト高度なモデル分析TensorFlowモデル分析学習インタプリタ・ツール高度なモデルのデバッグベンチマークモデル感度分析残留分析修復モデル差別是正公平性公正な評価公平性への配慮継続的な評価とモニタリング結論

説明可能なAIモデル解釈メソッドメソッドカテゴリー本質的に解釈可能なモデルモデル認識メソッド局所的に解釈可能なモデル-不可知論的説明シャプレーの価値観SHAPライブラリー概念活性化ベクターのテスト AIによる説明例SHAPでモデルの感度を探る回帰モデル自然言語処理モデル結論
ハイパーパラメーターのチューニングAutoML入門NASの主要コンポーネント検索スペース検索戦略パフォーマンス推定戦略クラウドのAutoMLAmazon SageMaker オートパイロットMicrosoft Azure 自動マシンラーニングGoogle Cloud AutoMLAutoMLを使うジェネレーティブAIとAutoML結論
モデルトレーニングモデル予測遅延スループットコストサーヴィス・モデルのリソースと要件コストと複雑さアクセラレーター野獣に餌を与えるモデルのデプロイデータセンターのデプロイモバイルと分散デプロイモデルサーバマネージド・サービス結論
バッチ推論バッチスループットバッチ推論の使用例分散バッチ処理およびストリーム処理システムのためのETLリアルタイム推論入門リアルタイム予測の同期配信リアルタイム予測の非同期配信リアルタイム推論の最適化リアルタイム推論の使用例モデル・アンサンブルに奉仕するアンサンブル・トポロジーアンサンブル例アンサンブルのサーブに関する考察モデルルーターGenAIにおけるアンサンブルリアルタイムでのデータ前処理と後処理トレーニングの変化とサーブの変化ウィンドウ前処理のオプションTensorFlowトランスフォームに入る後処理エッジとブラウザでの推論課題コンテナによるデプロイモデル機器に関するトレーニングフェデレーテッド・ラーニングランタイムの相互運用性ウェブブラウザにおける推論結論
モデルサーバTensorFlowサーヴィングNVIDIA Triton推論サーバトーチサーブスケーラブルなインフラを構築するコンテナ化従来のデプロイ時代仮想デプロイの時代コンテナデプロイの時代Dockerコンテナ化フレームワークコンテナオーケストレーション冗長性による信頼性と可用性可観測性高可用性デプロイの自動化ハードウェア・アクセラレーターGPUTPU結論
例TensorFlow ServingでTensorFlowモデルをデプロイするTFサービング用にKerasモデルをエクスポートするDockerでTF ServingをセットアップするTFサービングの基本構成RESTでモデル予測リクエストを行うgRPCでモデル予測リクエストを行う分類モデルと回帰モデルから予測を得るペイロードを使うTFサービングからモデルのメタデータを取得する一括推論リクエストを行う例TFプロファイラによるTFサーヴィングのプロファイリング前提条件TensorBoardのセットアップモデルプロフィール例TorchServeの基本セットアップTorchServeの依存関係をインストールするモデルをTorchServe用にエクスポートするTorchServeのセットアップモデルの予測依頼をする一括推論リクエストを行う結論
実験追跡ノートブックで実験する全体的な実験実験のトラッキングとバージョン管理のためのツールMLOpsの紹介データサイエンティストとソフトウェアエンジニアMLエンジニア製品とサービスにおけるMLMLOpsMLOpsの方法論MLOpsレベル0MLOpsレベル1MLOpsレベル2オーケストレーションされたワークフローの構成要素3種類のカスタム・コンポーネントPython 関数ベースのコンポーネントコンテナベースのコンポーネントフルカスタムコンポーネントTFX ディープ・ダイブTFX SDK中間表現ランタイムTFX コンポーネントを用いた ML パイプラインの実装TFXの高度な機能モデルのバージョンを管理するバージョニング・モデルへのアプローチモデルの系譜モデルレジストリ継続的インテグレーションと継続的デプロイ継続的インテグレーション継続的デリバリプログレッシブデリバリブルーグリーンデプロイカナリアのデプロイライブ実験結論
モニタリングの重要性マシン学習における可観測性何を監視すべきか？TFX におけるカスタムアラートロギング分散トレーシングモデル崩壊のモニタリングデータ・ドリフトと概念ドリフトモデル崩壊検出監視付きモニタリングテクニック教師なしモニタリングテクニックモデル崩壊を軽減するモデルを鍛え直す再トレーニングの時期自動再トレーニング結論
なぜデータプライバシーが重要なのか？非公開にすべきデータとは何か？ハームス必要なものだけを集めるGenAIはウェブやその他のソースからデータを収集した法的要件GDPRとCCPAGDPRの「忘れられる権利」について仮名化と匿名化差別化されたプライバシーローカルDPとグローバルDPエプシロンデルタDP差分プライバシーをMLに適用するTensorFlowのプライバシーの例フェデレーテッド・ラーニング暗号化されたML結論
パイプライン・オーケストレーション入門なぜパイプライン・オーケストレーションなのか？有向非周期グラフTFX によるパイプラインオーケストレーションインタラクティブTFXパイプラインインタラクティブ・パイプラインをプロダクション用に変換する Apache BeamでTFXパイプラインをオーケストレーションするKubeflow パイプラインで TFX パイプラインをオーケストレーションするKubeflowパイプライン入門インストールと初期化KubeflowパイプラインにアクセスするTFXからKubeflowへのワークフローOpFunc関数KubeflowパイプラインのオーケストレーションGoogle Cloud VertexパイプラインGoogle CloudとVertexパイプラインのセットアップGoogle Cloudサービスのアカウントをセットアップする頂点パイプラインでパイプラインをオーケストレーションする頂点パイプラインを実行するオーケストレーションを選択するインタラクティブ金融取アパッチ・ビームKubeflowパイプラインGoogle Cloud Vertexパイプライン金融取の代替案結論
高度なパイプラインの実践コンポーネントを設定する成果物をインポートするリゾルバノードを使用する条件付きパイプラインを実行する TFライトモデル輸出ウォームスタート・モデル・トレーニングイグジット・ハンドラを使う金融取からのトリガー・メッセージカスタム TFX コンポーネント：アーキテクチャと使用例TFX コンポーネントのアーキテクチャカスタム・コンポーネントの使用例関数ベースのカスタムコンポーネントを使うカスタムコンポーネントをゼロから書くコンポーネント仕様の定義コンポーネント・チャンネルの定義カスタムエクゼキュータを書くカスタムドライバーを書くカスタムコンポーネントを組み立てる基本的なカスタム・コンポーネントを使う実装レビュー既存のコンポーネントを再利用するコンテナベースのカスタムコンポーネントを作成するどのカスタム・コンポーネントが最適か？TFX-アドオン結論
データ我々のモデルカスタム・インジェスト・コンポーネントデータの前処理モデルをエクスポートするパイプラインデータの取り込みデータの前処理モデルトレーニングモデル評価モデル輸出すべてをまとめる Apache Beamで実行する頂点パイプラインで実行する TensorFlow Servingによるモデルのデプロイ結論
データ我々のモデル摂取成分データの前処理パイプラインをまとめるパイプラインを実行する Google Cloud Vertexを使ったモデルのデプロイMLモデルを登録する新しいモデルのエンドポイントを作成するMLモデルをデプロイするデプロイされたモデルに予測を求めるデプロイしたモデルをクリーンアップする結論
生成モデルGenAIモデルの種類エージェントとコパイロット事前トレーニング事前学習データセット埋め込みマスクによる自己教師ありトレーニング微調整微調整と転移学習の比較データセットを微調整する本番での微調整微調整とモデルAPIの比較パラメータ効率の良い微調整LORAS-ロラヒューマン・アライメント人間のフィードバックからの強化学習AIフィードバックからの強化学習直接選好最適化プロンプティングチェーン検索拡張世代リアクト評価評価テクニックモデル間のベンチマークLMOpsGenAIの攻撃脱獄迅速な注射責任あるGenAIレスポンスのためのデザイン敵対的テストを実施する立憲AI結論
MLモデルではなくMLシステムで考えようMLシステムをドメイン専門家に近づけるプライバシーはかつてないほど重要になっている結論

Content preview from マシンラーニング本番システム

序文

私がAIとマシンラーニング（ML）で大ブレイクしたのは約20年前のことだ。インターネットがまだ新技術のように感じられた時代だった。自由なコミュニケーションの力には利点だけでなく欠点もあることに世界は気づいていた。迷惑メールは、薬の勧誘や銀行口座情報を求める詐欺など、いたるところで受信トレイを埋め尽くしていた。

電子メールのスパムが猛威を振るっていたのは、利用可能なスパムフィルターが（主に手作業で作られた規則やパターンに基づいていたため）効果がなかったからだ。スパマーは、固定規則が適応しにくい、イントセント！オンなミ$$$スペリングや、その他のハッキングのような、あらゆる種類のトリックでこれらのフィルタを欺いた。当時大学院生だった私は、機械学習と呼ばれるおかしな技術がこのような問題の解決に適しているかもしれないと信じていた研究者のコミュニティの一員となった。私は幸運にも、電子メールのスパムフィルタリングに関する初期のベンチマークコンテストで優勝するモデルを作成することができた。

私がその初期のモデルを覚えている理由は2つある。第一に、シンプルだが非常に柔軟な文字列表現、今でいう文字列の一次元畳み込みの先駆け的なものを使うことでうまく機能していたことが、ちょっとクールだった。第二に、振り返って確信を持って言えるのは、これを本番環境に投入するのは絶対的な混乱だっただろうということだ。それは学術研究のプレッシャーのもとで設計されたもので、信頼性よりも速度が優先され、迅速な修正と一度だけ機能するパッチで十分すぎるほどだった。私はそれ以上のことを知らなかった。MLパイプラインを実運用で動かしている人に実際に会ったこともなかった。当時は、プロダクションとマシンラーニングが同じ文章で使われているのを聞いたことすらなかったと思う。

私が最初に設計・構築した本番システムは、Googleの初期のシステムで、ポリシーに違反した広告（基本的には詐欺やスパムのような広告）を検出して削除するものだった。これは重要な仕事であり、この方法でユーザを守ることに非常にやりがいを感じていた。当時は、MLの本番システムを作成することが、すべてをゼロから構築することを意味していた時代でもあった。PyTorchやTensorFlowよりもずっと前のことで、信頼できるスケーラブルなライブラリはなく、データストレージ、モデル学習、配信などのインフラはすべてゼロから構築しなければならなかった。ご想像の通り、このことは、検証、モニタリング、安全性チェック、ロールアウト計画、更新メカニズム、解約への対処、ノイズへの対処、信頼性の低いラベルの扱い、不安定なデータ依存性への遭遇など、プロダクションMLで考えられるあらゆる落とし穴に直面することを意味した。これらの教訓を学ぶのは大変だったが、この経験は間違いなく印象に残った。

数年後、私はGoogleの検索広告のクリックスルー予測システムを率いていた。当時、このシステムはおそらく世界最大級のものであり、ビジネスの観点からは最も影響力のあるMLシステムであった。そのため、信頼性が最も重要であり、同僚と私が行った仕事の多くは、本番システムの堅牢性を強化することだった。これには、インフラ的な観点からのシステムレベルの堅牢性と、時間の経過によるデータの変化がうまく処理されることを保証する統計的堅牢性の両方が含まれていた。この規模と重要性でMLシステムを稼働させることは、まだ非常に新しいことであったため、私たちはこの多くを自分たちで考案しなければならなかった。そのうちのひとつが、「機械学習」という陽気なタイトルだった：技術的負債という高金利のカード」と題したもので、私たちが学んだことをこの分野の他の人たちと分かち合いたいと願っていた。そして、TensorFlow ...