book

生産性のためのハンズオンRAG (Japanese Edition)

Name: 生産性のためのハンズオンRAG (Japanese Edition)
ISBN: 0642572397647

by Ofer Mendelevitch, Forrest Sheng Bao

May 2026

358 pages

5h 53m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

シャロン・チョウによる序文
ジム・ダウリングによる序文
序文
本書の内容本書の読者層この本はこんな人には向かないコード例の活用前提条件本書の構成本書で使用している表記規則O’Reilly Online Learning問い合わせ先謝辞
1. RAG（検索拡張生成）の導入部
RAGはどのように機能するのかRAGスタックの青写真取り込みフロークエリフロー例：LangChain を使った RAGRAGと他のアプローチの比較RAGと「PDFとのチャット」の比較RAGとファインチューニングの比較RAGの主な利点RAGは拡張性があり効率的だRAGはハルシネーションの発生を抑制するRAGは説明可能性を実現する知識のほぼ瞬時の追加と除去アクセス制御とセキュリティRAGのユースケースバーチャルアシスタントとAIチャットボット企業のナレッジマネジメントと社内検索コンテンツの自動生成と文書要約魅力的で効果的なパーソナライゼーション広告の生成質問応答システム医療・ヘルスケア分野のアプリケーション法務およびコンプライアンス調査高度なRAGエージェント型RAGマルチモーダルRAGナレッジグラフを活用したRAGまとめ
2. 基本となるRAGスタック
RAGスタックのフローデータ取り込みフロークエリフロードキュメントの解析様々なファイル形式からのテキスト抽出視覚言語モデルを用いた文書解析コード例：ファイルの解析テキストのチャンキングチャンキング戦略コード例：Pythonでのチャンキング埋め込みモデルエンベディングとは何か埋め込みモデルの選定基準実用的なヒントと考慮事項コード例：Sentence Transformers による埋め込みの生成ベクトルデータベースとベクトル検索ベクトルベースの類似性検索の理解近似最近傍アルゴリズムベクトルデータベースベクトル検索を使用する際のパラメータコード例：pgvectorを使用したベクトルの保存と検索生成型LLMsLLMsRAGプロンプトエンジニアリングLLMsとプロンプトテンプレートの評価コード例：Anthropic Claude を使用した RAG でのレスポンス生成まとめ
3. RAGスタックのスケーリング
大規模RAG文書の量と複雑さインデックスの鮮度コスト管理と最適化高度なデータ取り込み大量のドキュメントの取り扱いデータ品質の非一貫性への対応大容量文書の処理例：大容量のPDFファイルの分割文書の更新とリフレッシュの管理高度な検索2段階の検索パイプラインハイブリッド検索再ランク付けガードレールの実装AIの安全性を確保するためのガードレールプロンプトインジェクション攻撃の防止RAGにおけるハルシネーションの制御RAGにおけるハルシネーションの定義LLMのハルシネーションとRAGのハルシネーションハルシネーションの検出ハルシネーションの修正優れたRAGユーザ体験の構築RAGのユーザ体験に関する考慮事項マルチモーダルユーザインタフェースツールと参照実装結論
4. RAGの本番環境へのデプロイ
本番環境におけるRAGの課題レスポンス品質とハルシネーションの低減高遅延データのセキュリティとプライバシーベンダ間の混乱と統合の課題チームと専門知識合計所有コストRAG評価参照プロダクション・アーキテクチャ概念実証から本番環境への移行の成功概念実証で学んだことの要約目標と要件の定義RAGの継続的な成功を確保する結論
5. RAGプラットフォーム
DIYとプラットフォーム型RAGの比較RAGの主要機能データソースRAGのスプロールと一元的なガバナンスコストと維持管理デプロイオプションRAGプラットフォームの例：VectaraはじめにVectaraへのデータ取り込みクエリの実行ハルシネーションの修正その他のRAG管理APIエンドポイント結論
6. RAGアプリケーションの評価
RAGはどのように失敗するのか検索の失敗生成の失敗データ取り込みの不備による失敗RAGの失敗の概要評価へのLLMsの活用：審査員としてのLLM審査員としてのLLMとは何か審査員としてのLLMの仕組みRAG評価基準検索メトリック生成メトリックバイアスと安全性RAG評価サービスOpen RAG Eval検索拡張生成の評価DeepEvalAmazon Bedrock人間のフィードバック本番環境へのRAG評価の統合本番環境における審査員としてのLLMの活用オフラインRAG評価オンラインRAG評価システムメトリック：遅延と稼働率遅延とスループット信頼性と稼働時間コストとリソース効率性結論
7. RAGからAIエージェントへ
AIエージェントとは何かエージェントスタックシングルエージェント対マルチエージェントシステムエージェント型ユースケースカスタマーサービスにおけるエージェント金融サービスにおけるエージェントヘルスケア分野におけるエージェント型AIAIコーディングエージェントエージェントループツール呼び出しモデルコンテキストプロトコルモデルコンテキストプロトコルのアーキテクチャ企業向けエージェント型AIにおけるMCPエージェント間コミュニケーションAgentic AIフレームワークの実践LangChainを使用したAIチャットボットLlamaIndexを用いた文書生成エージェントVectaraを用いたエージェントの構築CrewAIを用いたマルチエージェントシステムの構築エージェント型メモリ短期記憶と長期記憶Agentic RAGを用いた実装メモリエンタープライズ・ガードレール：プライバシーと完全性AIエージェントによる評価と可観測性エージェントの可観測性エージェントのトレースエージェント型可観測性のメトリックエージェント型可観測性のためのツール結論

8. マルチモダリティRAG
表が埋め込まれたドキュメント埋め込みテーブルの重要性とは？ドキュメントからのテーブル抽出なぜ単純なチャンキングではテーブルの処理に失敗するのかRAG向けテーブルのプロセス複数ページにわたる表の処理画像が埋め込まれたドキュメント画像要約のアプローチ共有埋め込みスペースを用いたマルチモダリティ検索RAGにおける音声と動画ベースライン：高忠実度トランスクリプト視覚的意味論：「赤いボタン」問題本番環境での考慮事項計算コストと遅延モダリティの整合インタフェース層：視覚的引用セキュリティ、プライバシー、ガバナンス大規模環境におけるディープ・可観測性、トレース、およびセキュリティマルチモダリティRAGにおけるハルシネーションと評価マルチモダリティによるハルシネーションの検出マルチモダリティ検索と生成の評価結論
9. 知識強化型RAG
ナレッジグラフ：概要ナレッジグラフの検索方法オントロジー対スキーマRAGにおけるナレッジグラフの活用映画のためのナレッジグラフの構築クエリ実行時のナレッジグラフの活用エンリッチメントとハイブリッド検索の選択ナレッジグラフの構築ナレッジグラフ構築の自動化標準オントロジーとナレッジグラフの活用GraphRAGグラフデータベースのデータベースインフラグラフの更新パターンと進化精度とコストのトレードオフ結論
10. RAGの未来
検索の進化エージェント型RAGへの移行データ・グラビティとフェデレーテッド・リトリーブの現実長いコンテキストの影響プロンプトエンジニアリングからコンテキストエンジニアリングへリアクティブ型からプロアクティブ型RAGへの移行エッジにおけるRAG：小型言語モデル大規模環境におけるガバナンスとコンプライアンス結論：生き続けるナレッジベース
索引
著者紹介

Content preview from 生産性のためのハンズオンRAG (Japanese Edition)

第5章 RAGプラットフォーム

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

第2章と第3章では、埋め込みモデルやベクトルデータベースといった基本的な構成要素から、ハイブリッド検索、再ランク付け、ハルシネーション検出といったより高度な構成要素に至るまで、DIY RAGのすべてについて学んだ。第4章では、DIY RAGアプリケーションを単純な概念実証から本番環境での完全なデプロイへと移行させる作業が、当初思われるよりも複雑になりがちな理由を探り、実世界でのRAGのスケーリングに伴う主な課題を浮き彫りにし、本番環境でのDIYデプロイを成功させるための手順を提案した。

の「RAGプラットフォーム」（RAG-as-a-serviceやターンキーRAGとも呼ばれる）とは、開発者向けAPIの背後で、RAG構成要素のすべてではないにせよ大部分を実装する技術プラットフォームを指す。これにより、RAG構築に伴う複雑さの多くが抽象化され、開発者は代わりにRAGアプリケーションそのものに集中できるようになる。つまり、レスポンスをどのデータに基づかせるべきか、またアプリケーションを自社のビジネスやアプリケーションフローにどのように統合するかといった点に注力できるのだ。

この章では、RAGプラットフォームが何を提供するのか、そしてニーズに最適なプラットフォームをどのように選ぶかについて解説する。Vectaraを用いて、そのようなプラットフォームの使用方法を実演する。

DIYとプラットフォーム型RAG

、DIYのRAGスタックを構築する場合、RAGパイプラインの各構成要素を細かく制御できる。これには、ベクトルデータベース（例：Pinecone、Weaviate、Zilliz、 Qdrant）の選択と設定、任意の埋め込みモデル（例：CohereのEmbed v4 やQwen3-Embedding-0.6B ）のホスティングと提供、チャンキング戦略の定義と実装、そしてLLM生成プロセスのカスタマイズが含まれる。

RAGスタックをカスタマイズする力は開発者にあるが、基盤となるインフラのプロビジョニング、統合、スケーリング、保守の責任もまた開発者にある。

対照的に、RAGプラットフォームは、インフラの複雑さを抽象化した、管理されたエンドツーエンドのソリューションを提供する。開発者はAPIを通じてサービスとやり取りし、データソースからデータを取り込み、検索パイプラインを選択・設定し、埋め込みモデルや生成モデルを選択し、最小限の設定でRAGアプリケーションをデプロイできる。

まさにこのインフラのオーバーヘッドからの解放こそが、RAGプラットフォームの優位性である。DIYアプローチでは、サーバのプロビジョニング、ベクトルDBの最適化、高可用性と低遅延の確保、各構成要素のセキュリティ更新管理といった非中核的なタスクに多大な労力を費やすことになる。 RAGプラットフォームプロバイダーはこうした運用上のオーバーヘッドを引き受けるため、ユーザーはアプリケーションロジックの構築とエンドユーザへの価値提供に専念できる。これにより、開発サイクルの短縮、DevOpsの作業負荷の軽減、そしてサービスが従量課金制やサブスクリプション方式で提供されることが多いため、初期のインフラコスト削減も期待できる。

さらに、RAGプラットフォームには、大規模なRAGシステムの管理におけるプロバイダーの専門知識を活用し、低遅延、高精度、および費用対効果を実現するための最適化機能が組み込まれていることが多い。RAGプラットフォームプロバイダーは、データソースコネクタ、高度な監視および可観測性、さらにはセキュリティやプライバシーのコンプライアンスといった機能を標準で提供する場合もあるが、これらを自作環境で再現するには多大なエンジニアリングの労力が必要となる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

The Human Factor in AI-Based Decision-Making

Publisher Resources

ISBN: 0642572397647

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

生産性のためのハンズオンRAG (Japanese Edition)

by Ofer Mendelevitch, Forrest Sheng Bao

第5章 RAGプラットフォーム

DIYとプラットフォーム型RAG

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.