まえがき
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
もしあなたがジェネレーティブAI(GenAI)アプリケーションを構築するAIエンジニアであれば、印象的なプロトタイピングを簡単に作成できることと、それを本番環境で確実にデプロイすることの複雑さのギャップに苛立った経験があるだろう。基盤モデルを使えば説得力のあるデモを作るのは簡単だが、本番システムでは、精度を損なうハルシネーション、下流プロセスを壊す一貫性のない出力、企業での適用を制限する知識のギャップ、重要なアプリケーションにシステムを適さない信頼性の問題など、基本的な課題に対する解決策が求められる。
本書は、、生産グレードのGenAIアプリケーションを構築する際に遭遇する、繰り返し起こる問題に対処する32の実戦テスト済みの設計パターンをプロバイダーすることで、そのギャップを埋める。これらのパターンは理論的な構成ではなく、しばしば最先端の研究から導き出され、GenAIシステムを大規模にデプロイすることに成功した実務家によって洗練された、実証済みの解決策を成文化したものである。
教師あり機械学習(ML)は、入力と出力の例からなる大規模なトレーニングデータセット上で問題に特化したモデルをトレーニングすることを含むが、 GenAIアプリケーションにトレーニングフェーズが含まれることはほとんどない。その代わりに、一般的には汎用の基盤モデルを使用する。本書は、Open AIのGPTモデル、AnthropicのClaude、GoogleのGemini、MetaのLlamaなどの基盤モデルの上に構築されるAIアプリケーションの設計パターンに焦点を当てている。
本書では、AIエンジニアリングのワークフロー全体をカバーする。第1章での導入部の後、第2章ではコンテンツの形式やスタイルを制御するための実践的なパターンを提供する(Logits Masking [パターン1]やGrammar [パターン2]を含む)。第3章と 第4章では、基本的なRAG(パターン6)から深層検索(パターン12)まで、洗練されたRAG(検索拡張生成)の実装を通じた外部知識の統合を取り上げる。第5章では、Chain of Thought(パターン13)、Tree of Thoughts(パターン14)、Adapter Tuning(パターン15)などのパターンを使ってモデルの推論能力を強化する。第6章では、LLM-as-Judge(パターン17)、Reflection(パターン18)、プロンプト最適化(パターン20)パターンによる信頼性の高いシステムの構築に重点を置いている。第7章は、Tool Calling(パターン21)やMultiagent Collaboration(パターン23)を含むエージェントシステムの作成についてである。第8章はデプロイの最適化(Small Language Model [パターン24]、Inference Distribution Testing [パターン27]を含む)、第9章は安全ガードレールの実装(Self-Check [パターン31]、Comprehensive Guardrails [パターン32]を含む)について述べている。
本書は誰のためのものか?
本書は、GenAIの基盤モデルによってアプリケーションを構築しているソフトウェアエンジニア、データサイエンティスト、エンタープライズアーキテクトのためのものである。本書は、GenAIアプリケーションとエージェントを構築する際に発生する一般的な課題を解決するために採用できる実証済みの解決策をまとめたものである。ハルシネーション、非決定的な答え、知識カットオフ、あなたの業界や企業向けにモデルをカスタマイズする必要性などの課題を、この分野のエキスパートがどのように扱っているかを学ぶためにお読みいただきたい。ソフトウェア工学の古くからの問題は、この領域で新たな解決策を持つ。例えば、遅延に対応しコストを抑制する方法として、蒸留、投機的デコード、プロンプトキャッシュ、テンプレート生成などがある。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access