9章スケーリング:ハードウェア、インフラ、リソース管理
LLMをデプロイして運用する際には、インフラとリソース管理の面で特有の課題が生まれます。本書を通じて見てきたように、LLMは計算負荷が非常に高く、効率良く動作させるために多くのハードウェア、ストレージ、ネットワークリソースが必要です。LLMをクラウドベースのサービスとして利用するときも、オンプレミスのデータセンターに事前学習済みモデルを展開するときも、あるいは独自モデルを一からトレーニングするときも、どのようなインフラを選ぶかが性能、拡張性、費用対効果を左右します。
LLMの効果的なリソース管理では、計算能力、メモリ、ストレージを最適化します。この章では、ハードウェア要件やデプロイ戦略を含むLLM向けインフラの主要な構成要素を取り上げます。また、本番環境でリソース利用を最適化し、コストを抑え、信頼性を維持するためのベストプラクティスについても説明します。本章を読むことで、大規模AIアプリケーションのリソースを管理するときに発生するトレードオフを理解できるようになります。
9.1 適切なアプローチ選択
LLMの適切な使用方法は、LLMを使用するアプリケーションの要件に依存します。スタートアップや小規模なアプリケーションの場合、クラウドで提供されるモデルを直接使うのが、最も迅速で費用対効果の高い解決策になることが多いです。一方、特別な要件や大規模なワークロードを抱える組織の場合、クラウドインフラ上にLLMをデプロイすることで柔軟性と拡張性の適切なバランスを見つけやすくなるでしょう。また、厳格なデータプライバシーやレイテンシーに関する要件がある組織の場合、ローカルデプロイによって他の方法では得られない制御性とセキュリティを確保できますが、運用の複雑さは増します。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access