Skip to Content
Google Cloud Platform 上でのデータサイエンス、第2版
book

Google Cloud Platform 上でのデータサイエンス、第2版

by Valliappa Lakshmanan
March 2025
Intermediate to advanced
462 pages
7h 19m
Japanese
O'Reilly Media, Inc.
Book available
Content preview from Google Cloud Platform 上でのデータサイエンス、第2版

第10章. バーテックスAIでMLOpsの準備をする

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

第9章では、TensorFlowモデルをJupyterノートブックで開発した。モデルをトレーニングし、エンドポイントにデプロイし、ノートブック環境から予測値を得ることができた。開発中はこれでうまくいったが、スケーラブルなワークフローではない。

JupyterノートブックでトレーニングしたTensorFlowモデルをVertex AIにデプロイしても、数百のモデルや大規模なチームにはスケールしない。再トレーニングは難しいだろう。なぜなら、運用チームは、実に不格好で合計が最小でないものの上に、運用と監視とスケジューリングのすべてをセットアップしなければならないからだ。

機械学習モデルを本番稼動させるためには、以下の要件を満たす必要がある:

  • モデルはバージョン管理下にあるべきである。gitのようなソースコード管理システムは、テキストとバイナリが混ざったファイル(.ipynbファイルなど)よりも、テキストファイル(.pyファイルなど)の方がずっとうまくいく。

  • データセットの作成からトレーニング、デプロイまでのプロセス全体は、コードによって駆動されなければならない。これは、GitHubアクションやGitLab継続的インテグレーションを使えば、新しく変更されたコードがチェックインされるたびに、トレーニングの実行を自動的に再トリガーすることが簡単にできるようにするためだ。

  • 再トレーニングは、Cloud Storageバケットへの新しいデータの到着など、コード以外の変化でトリガーできるように、プロセス全体は単一エントリポイントから起動できるようにする。

  • モデルやエンドポイントのパフォーマンスをモニターし、モデルコードを修正することなく、発生した問題のサブセットを修正するための対策を講じることは容易であるべきだ。例えば、GPUが飽和しつつある場合、トレーニングやサービングのためにリソースを追加することは容易であるべきだ。モデルを継続的に 評価し、入力特徴の分布が変化したり、評価メトリックが特定の閾値を下回ったりした場合は、モデルの再トレーニングをトリガーできるようにすべきである。

これらの基準を合わせてMLOpsと呼ぶ。一般化すればGoogle Cloud、特にVertex AIは、多くのMLOps機能を提供している。しかし、これらの内蔵機能を活用するためには、モデルコードとオペレーションコードを明確に分離し、ノートブックではなくPythonですべてを表現した方が良い。

Pythonを使った開発とデプロイ

Jupyterノートブックは開発には最適だが、Vertex AIがそれを可能にしてくれるとはいえ、これらのノートブックを本番環境に直接置くことは強くお勧めしない。

私がお勧めするのは、初期化したプロトタイピング・モデルのコードをPythonファイルに変換し、その中ですべての開発を続けることだ。Jupyterノートブックは捨てる。Pythonファイルはあなたのコードリポジトリにあり、今後維持されるコードベースになる。

本書のコードリポジトリにあるmodel.pyと train_on_vertexai.pyのファイル内のコードを見て、それらに従う。

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

AWS Lambdaのプログラミング

AWS Lambdaのプログラミング

John Chapin, Mike Roberts
セキュアで信頼性のあるシステム構築 ―Google SREが考える安全なシステムの設計、実装、保守

セキュアで信頼性のあるシステム構築 ―Google SREが考える安全なシステムの設計、実装、保守

Heather Adkins, Betsy Beyer, Paul Blankinship, Piotr Lewandowski, Ana Oprea, Adam Stubblefield, Kuma Arakawa, 渡邉 了介

Publisher Resources

ISBN: 9798341635968Supplemental Content