book

生成AIデザインパターン

Name: 生成AIデザインパターン
ISBN: 9798341671447

by Valliappa Lakshmanan, Hannes Hapke

October 2025

Beginner to intermediate

508 pages

8h 1m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
本書は誰のためのものか？本書で使用する規約コード例を使用するオライリーオンライン学習問い合わせ先謝辞
1.導入部
GenAIデザインパターン基盤モデルの構築プロンプトとコンテキストモデルプロバイダーのAPIを使うLLMに依存しないフレームワークを使うモデルをローカルで実行する基盤モデルはどのように作成されるか基盤モデルを取り巻く環境エージェント型AI自律性エージェントの特徴きめ細かな制御ロジット温度トップKサンプリング核サンプリングビーム検索コンテキスト内学習ゼロショット学習少数ショット学習ポストトレーニングポストトレーニング・メソッドフロンティアモデルのファインチューニングオープンウエイトモデルのファインチューニング考察本書の構成
2.コンテンツのスタイルをコントロールする
パターン1：ロジットマスキング問題点解決策例考察参考文献パターン2：文法問題点解決策参考例考察参考文献パターン3：スタイル・トランスファー問題点解決策考察参考文献パターン 4：逆中和問題点解決策例1: リーガルテキストの生成例2：個人的なスタイル考察参考文献パターン5：コンテンツ最適化問題点解決策例考察参考文献まとめ
3.知識を加えるベース
パターン6：基本RAG問題点解決策例考察参考文献パターン7：セマンティック・インデクシング問題点解決策例考察参考文献パターン8：規模に応じたインデックス作成問題点解決策例考察参考文献要約
4.知識を加える：シンコペーション
パターン9: インデックスを考慮した検索問題点解決策例考察参考文献パターン10: ノードの後処理問題点解決策例考察参考文献パターン11：信頼できる生成問題点解決策例考察参考文献パターン12：深い検索問題点解決策例考察参考文献要約
5.モデルの能力を拡張する
LLM推論の限界既知の能力未知の能力パターン13：思考の連鎖問題点解決策例考察参考文献パターン14：思考の木（ToT）問題点解決策例考察参考文献パターン15：アダプター・チューニング問題点解決策例考察参考文献パターン16：エボルインストラクト問題点解決策例考察参考文献まとめ
6.信頼性の向上
パターン17：審査員としてのLLM問題点解決策例考察参考文献パターン18：リフレクション問題点解決策例考察参考文献パターン19：依存関係の注入問題点解決例解決策考察参考文献パターン20：プロンプト最適化問題点解決策例考察参考文献要約
7.エージェントの行動を可能にする
パターン21：ツール呼び出し問題点解決策例考察参考文献パターン22：コード実行問題点解決策例考察参考文献パターン23：マルチエージェントコラボレーション問題点解決策例考察参考文献まとめ
8.制約に対処する
パターン24：小さな言語モデル問題点解決策例考察参考文献パターン25：プロンプトキャッシュ問題解決策例考察参考文献パターン26：推論最適化問題点解決策例参考文献パターン27：劣化テスト問題点解決策解決例参考文献パターン28：長期記憶問題点解決策例考察参考文献まとめ
9.セーフガードをセットする
パターン29：テンプレート生成問題点解決策例考察参考文献パターン30：組み立てリフォーマット問題点解決策例考察参考文献パターン31：セルフチェック問題点解決策例考察参考文献パターン32：ガードレール問題点解決策例考察参考文献まとめ

10.コンポーザブル・エージェント・ワークフロー
エージェントワークフローアプリケーションを実行するアプリケーションの機能システムアーキテクチャデプロイするまとめ
目次
著者紹介

Content preview from 生成AIデザインパターン

第8章. 制約に対処する

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

本番環境にLLMをデプロイする LLMは、単にモデルを動作させるだけでは済まない、ユニークなチャレンジのセットを提示する。LLMは驚くべき機能を提供する一方で、かなりのコンピューティングリソースを必要とし、遅延の懸念が生じ、規模が大きくなるとすぐにコスト高になる可能性がある。単一のクエリで動作する概念実証と、数千のユーザにサービスを提供する本番システムとの間のギャップは、しばしば見落とされがちである。

この章では、LLMを本番システムにデプロイする際に直面しそうな懸念に対処するパターンを提供する。ハードウェアの制限、予算の制約、厳しい遅延要件など、ここで紹介するパターンは、LLMデプロイを最適化するための実証済みの戦略を提供する。

生産制約のさまざまな側面に取り組む5つの主要なパターンを探る。小さな言語モデル（パターン24）のセクションでは、モデルの蒸留と量子化テクニックによって計算オーバーヘッドを削減する方法を示す。プロンプト・キャッシングのセクション（パターン25）では、冗長性を排除し、コストと遅延の両方を削減する方法を示す。推論の最適化」（パターン26）では、連続バッチ処理や投機的デコードなどの高度なテクニックを取り上げ、ハードウェアの利用率を最大化する。劣化テストのセクション（パターン27）では、LLMベースのアプリケーションが良好なパフォーマンスであることを検証するために必要なメトリックを提供し、また、パフォーマンスのある側面で不足している場合に取ることができる対処法についても説明している。最後に、Long-Term Memory (パターン28)のセクションは、セッション間のユーザ履歴を保持し、パーソナライゼーションのためにユーザのリクエストを記憶するのに役立つ。

まとめてデプロイすることで、この章のパターンは、リソース集約的なLLMデプロイを効率的でスケーラブルな本番システムにトランスフォーメーションするための包括的なツールキットを形成する。

パターン24：スモール言語モデル

Small Language Model (SLM)パターンは、品質を過度に損なうことなく、コストと遅延の制約にうまく適合するような小さなモデルを使うことを可能にするテクニックのセットである。知識蒸留は知識範囲を狭めることでモデルのサイズを小さくし、量子化はモデル・パラメータの精度を下げることでメモリ消費を少なくし、投機的デコーディングは小さなモデルを使ってトークンを生成し、大きなモデルを使ってそれをバックアップする。

問題点

自分のハードウェアでフロンティアLLMを実行するには、、最新鋭のグラフィック・プロセッシング・ユニット（GPU）と仮想マシン（VM）が必要で、それには大量のメモリが必要となる。インフラがハイパースケーラー（AWS、Azure、GCP、OCIなど）上にある場合、これらの要件には高額なクラウド料金と希少性が伴う-本稿執筆時点で、ハイパースケーラーは日常的に必要なハードウェアリソースを使い果たしている。もしあなたがプロバイダーのAPI経由でフロンティアLLMを呼び出すなら、マシンを操作する必要はないが、コストと可用性の問題はなくならない。

簡単にするために、このセクションではローカルで実行していると仮定する。しかし、この解決策は、完全に管理されたリモート版の基盤モデルだけを使用している場合にも適用できる。アプリケーションへのコストと可用性の影響を減らすために、類似性のあるホスト版のSLMに変更することもできる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341671447

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

生成AIデザインパターン

by Valliappa Lakshmanan, Hannes Hapke

第8章. 制約に対処する

パターン24：スモール言語モデル

問題点

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.