2章LLMOps入門
LLMのモデルを本番で運用するには、モデルのデプロイ、監視、評価、性能の最適化などを行う必要があります。しかし、これらの本番運用には、LLMのアーキテクチャが持つ規模と複雑さに起因する特有の難しさがあります。
アプリケーションによっては、データ処理の方法、プロンプトの保存と動的な調整の手順、ユーザーとのやり取りの監視が論点となります。また、モデルが誤情報を広めたり、トレーニングデータを丸暗記して個人情報を漏洩したりしないようにする対策も必要になります。このように新たな課題が絶え間なく現れる中で、LLMを日々管理し、本番環境で適切に運用していくには、新しいフレームワークが必要です。
LLMOpsは、LLMアプリケーションを本番で運用するためのフレームワークです。その名称と原則は、先行するMLOpsやDevOpsに着想を得ていますが、LLMOpsならではの繊細な配慮が数多く考慮されています。そして、技術的負債の削減、コンプライアンスの維持、LLMの動的で実験的な性質への対応を支援し、よくある落とし穴を避けることで運用リスクと風評被害を最小化するのに役立ちます。
本章では、まずLLMOpsとは何か、MLOpsとLLMOpsの違いを説明します。続いて、LLMOpsエンジニアという役割とそれが既存の機械学習チームにどのように位置付けられるのかを紹介します。その上で、チーム内のLLMOpsの準備状況を測定する方法、組織全体のLLMOpsの成熟度を評価する方法、成功を測るための重要なKPIを特定する方法を説明します。本章の終盤では、LLMアプリケーションを本番運用する際の特有の課題について概説します。
2.1 運用フレームワークとは
運用フレームワークは、組織内の複雑なワークフローやパイプラインを管理するための体系的なアプローチを提供します。こうしたフレームワークは、組織のプロセスを自動化し合理化するためにツールとプラクティスを統合し、プロジェクトのライフサイクル全体で一貫性と品質を担保します。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access