第2章 LLMOps入門 LLMOpsの導入部
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
LLMのモデルのサイズとアーキテクチャの複雑さは、 これらのモデルをプロダクション化することを信じられないほど難しくしている。プロダクション化とは、単にモデルをデプロイするだけでなく、それを監視し、評価し、パフォーマンスを最適化することを意味する。
常に新しい課題がある。アプリケーションによっては、データのプロセス、プロンプトのストアと動的適応方法、ユーザとのやり取りの監視方法、そして最も重要な、モデルが誤った情報を広めたりトレーニングデータを記憶したりしないようにする方法(個人情報を公開する可能性がある)などが含まれる。そのため、LLMを運用する、つまりプロダクションで日々管理するためには、新しいフレームワークが必要なのだ。
LLMOpsと呼ばれるこのフレームワークは、LLMアプリケーションを本番環境で運用するためのフレームワークである。LLMOpsの名前と原則は、MLOpsとDevOpsにインスパイアされているが、LLMOpsはよりニュアンスが強い。LLMOps フレームワークは、企業が技術的負債を減らし、コンプライアンスを維持し、LLM の動的で実験的な性質に対処し、よくある落とし穴を回避することで運用リスクと評判リスクを最小化するのに役立つ。
この章では、まずLLMOpsとは何か、MLOpsとどこがどのように異なるのかについて説明する。次に、LLMOpsエンジニアの役割と、それが既存のMLチームにどのようにフィットするかを紹介する。そこから、チーム内でのLLMOpsの準備状況を測定する方法、組織のLLMOpsの成熟度を評価する方法、成功を測定するための重要なKPIを特定する方法について見ていく。この章の終わりには、LLMアプリケーションのプロダクション化に特有の課題について概説する。
運用フレームワークとは何か?
運用フレームワーク は、組織内の複雑なワークフローやパイプラインを管理するための、構造化されたアプローチを提供する。これらのフレームワークは、組織のプロセスを自動化・合理化し、プロジェ クトのライフサイクル全体にわたって一貫性と品質を確保するためのツールやプラク ティスを統合したものである。
最も古いフレームワークのいくつかは、軍事戦略や産業革命にまで遡ることができる。 最も人気のある2つのものは、どちらも1986年に導入されたもので、トヨタのリーン生産システム( )と、モトローラのデータ駆動型アプローチであるシックスシグマ( )である。
2008年、ハイテク業界は、現在ソフトウェア業界で最も人気のある演算フレームワークの1つであるものを採用し始めた: DevOpsである。(2018年には、非再生的機械学習(ML)モデルのフレームワークであるMLOpsが話題となった。それ以来、SecOps(セキュリティ・オペレーション)、DataSecOpsなど、さまざまなものが登場している。
2023年にLLMが大量に採用されたことで、LLMアプリケーションを構築している企業内で新しい運用フレームワークが出回り始めた:LLMOpsだ。LLMOpsはまだ黎明期にあるが、ジェネレーティブモデルがソフトウェア製品に不可欠になるにつれ、その人気は急上昇するだろう。
図2-1は、長年にわたるOpsフレームワークの緩やかな上昇を示している。LLMsの使用は、2023年初頭にLLMsが大量に採用されたことで増加し始めた。この記事を書いている時点では、LLMベースのオファリングで付加価値と利益を上げられることに気づく企業が増えており、LLMOpsの上昇トレンドにつながっている。実際、2025年はLLMOpsフレームワークにとって最高の年になるかもしれない。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access