book

LLMOps

Name: LLMOps
Author: Abi Aryan
ISBN: 9798341663770

by Abi Aryan

July 2025

Intermediate to advanced

284 pages

4h 30m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
本書で使用されている規約オライリー・オンライン・ラーニング問い合わせ先謝辞
1.大規模言語モデルの導入部
主要な用語トランスフォーマーモデル大規模言語モデルLLMアーキテクチャエンコーディング専用LLMデコーダのみのLLMエンコーダー・デコーダーLLM状態空間アーキテクチャ小さな言語モデルLLMの選択LLMの選択における考慮事項大きな議論オープンソースとプロプライエタリLLMの比較LLMの企業ユースケース知識検索翻訳音声合成推薦システム自律型AIエージェントエージェントシステムLLM構築の10の課題1.サイズと複雑さ2.トレーニングの規模と期間3.プロンプトエンジニアリング4.推論の遅延とスループット5.倫理的考察6.リソースのスケーリングとオーケストレーション7.統合とツールキット8.幅広いアプリケーション9.プライバシーとセキュリティ10.コスト結論参考文献
2.LLMOpsの導入部
運用フレームワークとは何か？MLOpsからLLMOpsへ：なぜ新しいフレームワークが必要なのか？LLMOpsの4つの目標LLMOpsのチームと役割LLMOpsエンジニアの役割一日の流れLLMOpsエンジニアを外部から雇用する社内で採用するMLOpsエンジニアをLLMOpsエンジニアにアップスキルするLLMと組織LLMOpsの4つの目標信頼性スケーラビリティ堅牢性セキュリティLLMOps成熟度モデル結論参考文献さらなる読み取り
3.LLMベースのアプリケーション
アプリケーションでAIモデルを使用するインフラアプリケーションエージェントワークフローモデルコンテキストプロトコルエージェント間プロトコルvLLMとマルチモダリティLLMの台頭LLMOpsの疑問アプリケーション・パフォーマンスの監視コンシューマLLMアプリケーションのパフォーマンスを測定するアプリケーションに最適なモデルを選択するその他のアプリケーションのメトリックLLMベースのアプリケーションで何をコントロールできるか？プロンプトエンジニアリングは "難しい"プロンプトエンジニアリングはより良い結果をもたらしたか？LLMベースのインフラシステムは "難しい"結論参考文献
4.LLMのためのデータエンジニアリング
データエンジニアリングとLLMの台頭データオプスエンジニアの役割データ管理合成データLLMパイプラインLLMのトレーニングデータ構成スケーリング法則データのパターンと繰り返しデータの品質LLMの一般的なデータ前処理パイプラインステップ1：データのカタログ化ステップ2：プライバシーと法令遵守の確認ステップ3：データをフィルタリングするステップ4：データの重複排除を行うステップ5：データを収集するステップ6：エンコーディングの検出ステップ7：言語の検出ステップ8：チャンキングステップ9：データのバックアップステップ10: データのバックアップメンテナンスとアップデートの実行ベクトル化ベクター・データベース新鮮なデータを維持するファインチューニングデータセットを生成する命令ファインチューニングデータセットを自動的に生成する結論参考文献さらなる読み取り
5.LLMベースアプリケーションのモデルドメイン適応
LLMをゼロからトレーニングするステップ1：タスクを選ぶステップ2：データを準備するステップ3：モデルアーキテクチャを決めるステップ4：トレーニングインフラをセットアップするステップ5：トレーニングの実装モデルアンサンブルのアプローチモデルの平均化とブレンド重み付きアンサンブル積み重ねアンサンブル（2段階モデル）堅牢性のための多様なアンサンブル多段階復号と投票メカニズムコンポーザビリティソフト・アクター・クリティックモデルドメインの適応プロンプトエンジニアリング一発プロンプトFew-shotプロンプティング思考の連鎖プロンプティング検索拡張生成意味カーネルファインチューニング適応的ファインチューニングアダプター（単一、並列、拡大並列）振る舞いファインチューニングプレフィックス・チューニングパラメータ効率の良いファインチューニング人間のフィードバックによる命令チューニングと強化学習ファインチューニングとプロンプトエンジニアリングの選択専門家の混合リソースに制約のあるデバイスのモデル最適化効果的なLLM開発のためのレッスンスケーリングの法則チンチラモデル学習率の最適化投機的サンプリング結論参考文献
6.APIファーストのLLMデプロイ
モデルをデプロイするステップ1：環境をセットアップするステップ2：LLMをコンテナ化するステップ3：Jenkinsでパイプラインを自動化するステップ4：ワークフロー・オーケストレーションステップ5：モニタリングのセットアップLLM用APIの開発API主導のアーキテクチャ戦略REST APIAPIの実装ステップ1：APIのエンドポイントを定義するステップ2：API開発フレームワークを選択するステップ3: APIをテストする資格情報管理APIゲートウェイAPIのバージョン管理とライフサイクル管理LLMデプロイのアーキテクチャモジュラー・アーキテクチャとモノリシック・アーキテクチャマイクロサービスベースのアーキテクチャを実装する検索再ランカー・パイプラインによるRAGの自動化ナレッジグラフ更新の自動化デプロイの遅延最適化複数のモデルのオーケストレーションRAGパイプラインの最適化非同期クエリ密と疎の検索メソッドを組み合わせるキャッシュの埋め込みキーバリューキャッシュスケーラビリティと再利用性結論
7.LLMの評価
評価が難しい理由パフォーマンスの評価すべてが壊れる前に壊れるものを評価するRAGアプリケーションのメトリックエージェントシステムのメトリック一般化された評価に関する考察自動化されたメトリックの価値モデルのドリフト従来のメトリックでは十分ではない可観測性パイプライン前処理とプロンプトの構築RAGパイプラインにおける検索LLM推論後処理と出力の検証フィードバックの取得結論参考文献
8.ガバナンス監視、プライバシー、セキュリティ
データの問題規模と感度セキュリティリスクプロンプトインジェクション脱獄その他のセキュリティ・リスク防御策LLMSecOpsLLMSecOps監査の実施ステップ1：スコープとオブジェクトの定義ステップ2：情報収集ステップ 3: リスク分析と脅威モデリングの実施ステップ4：セキュリティコントロールとコンプライアンスの評価ステップ5：ペネトレーションテスト及び／又はレッドティームの実施ステップ 6: トレーニングデータのレビューステップ 7: モデルのパフォーマンスとバイアスを評価するステップ8：監査の発見と勧告を文書化するステップ9：継続的なモニタリングとレビューを計画するステップ10コミュニケーションと改善計画の作成安全性と倫理的ガードレール結論参考文献
9.スケーリング：ハードウェア、インフラ、リソース管理
適切なアプローチを選択するスケーリングとリソース割り当てモニタリングLLMのA/Bテストとシャドーテストインフラの自動プロビジョニングと管理クラウドアーキテクチャにおけるプロビジョニングと管理所有ハードウェアにおけるプロビジョニングと管理インフラ自動管理のベストプラクティススケーリング法則と計算最適化引数LLMインフラの最適化カーネル・フュージョン高精度スケーリングハードウェアの利用LLMのための並列性と分散性コンピューティングデータ並列性モデル並列性パイプライン並列性高度なフレームワーク：ZeROとDeepSpeedLLMアプリケーションのバックアップとフェイルセーフプロセスバックアップ戦略の種類最も重要な実践：定期的にリストアをテストする結論参考文献

10.LLMとLLMOpsの未来
現在の枠を超えたスケーリングハイブリッドアーキテクチャ：ニューラルネットワークと記号的AIの融合スパースモデルと混合モデルメモリ増強モデル：永続的でコンテキストに富んだAIを目指してインタプリタブルモデルと自己最適化モデルクロスモデルコラボレーション、メタラーニング、マルチモーダルファインチューニングRAGLLMOpsの将来GPUテクノロジーの進歩データ管理と効率性プライバシーとセキュリティ包括的な評価フレームワークLLMOpsエンジニアとして成功する方法まとめ参考文献さらなる読み取り
インデックス
認可について

Content preview from LLMOps

第9章スケーリングハードウェア、インフラ、リソース管理

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

のデプロイとLLMの管理は、インフラストラクチャーとリソース管理の領域で、ユニークな課題と機会を提供する。LLMは、本書を通しておわかりのように、コンピューティングリソースを大量に必要とし、効率的に演算子するには、かなりのハードウェア、ストレージ、およびネットワークリソースを必要とする。LLMをクラウドベースのサービスとして活用する場合でも、オンプレミスのデータセンターで事前にトレーニングされたモデルをデプロイする場合でも、独自のモデルをゼロからトレーニングする場合でも、インフラの決定がパフォーマンス、スケーラビリティ、費用対効果の高さに影響する。

LLMの効果的なリソース管理には、コンピューティングリソース、メモリ、ストレージの最適化が含まれる。この章では、ハードウェア要件やデプロイ戦略など、LLMのためのインフラストラクチャの主要な構成要素を探る。また、本番環境におけるリソース利用の最適化、コスト管理、信頼性維持のためのベストプラクティスについても説明する。この章は、大規模AIアプリケーションのリソース管理に関わるトレードオフを理解するのに役立つ。

適切なアプローチを選択する

LLMの適切な使用方法の選択は、LLMを使用したいアプリケーションの要件に依存する。新興企業や小規模アプリケーションの場合、クラウドから直接モデルを使用するのが最も迅速で費用対効果の高い解決策となる。特別な要件や高いワークロードを抱える企業にとっては、クラウドインフラ上にLLMをデプロイすることで、柔軟性とスケーラビリティの適切なバランスを発見することができる。最後に、厳格なデータプライバシーや遅延要件がある演算子にとって、ローカルデプロイは比類のない制御とセキュリティを提供するが、その代償として運用の複雑さが増す。

各アプローチのトレードオフを慎重に評価することで、組織はLLMデプロイ戦略を技術的およびビジネス上のオブジェクトと整合させることができ、トランスフォーマーであるAIテクノロジーを効率的かつ効果的に活用することができる。

どの解決策を選ぶにせよ、私が提案するのは、常にサードパーティのAPIベースのアプローチから始めること、つまり、クラウドから直接モデルを使うことから始めることだ。私が実世界でのデプロイで観察した大きな問題のひとつは、LLMが与えられた問題に対して良い解決策かどうかを見極めることだ。サードパーティのAPIベースのアプローチを使えば、インフラに大きな数のリソースをコミットする前に、プロトタイピングでその疑問に答えることができる。

スケーリングとリソース割り当て

LLMベースのアプリケーションでパフォーマンス、費用対効果、信頼性を維持するには、リソースをうまく管理する必要がある。リソース、特にAIシステムを動かすのに必要なGPUやメモリ帯域幅など、需要の高いリソースを全体的に割り当てると、不必要な出費につながる。リソースの割り当てが不十分だと、システムクラッシュやユーザ体験の低下のリスクにさらされる。

トレーニングの失敗のほとんどは、コンピュートではなくメモリ不足に起因する。私はこれを "氷山問題 "と呼んでいる。目に見える先端は失敗であるが、本当の隠れた問題はその下にあるメモリの非効率性である。ほとんどの人は、最適でないメモリ使用が気づかれず、十分に活用されていないことが本当のミスアウトであることに気づいていない。こうして、人々は多くのパフォーマンスをテーブルの上に置き去りにしてしまうのだ。メモリの壁にぶつかっているのなら、まだハードウェアの増設に手を伸ばすべきではない。シャーディング、アクティブ化チェックポイント、ダイナミックバッチ、モデルオフロードなどのメソッドを正しく使えば、24GBのコンシューマGPUを48GBのA100のように簡単に動作させることができる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341663770

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design