Skip to Content
生産性のためのハンズオンRAG (Japanese Edition)
book

生産性のためのハンズオンRAG (Japanese Edition)

by Ofer Mendelevitch, Forrest Sheng Bao
May 2026
358 pages
5h 53m
Japanese
O'Reilly Media, Inc.
Content preview from 生産性のためのハンズオンRAG (Japanese Edition)

第5章 RAGプラットフォーム

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

第2章第3章では、埋め込みモデルやベクトルデータベースといった基本的な構成要素から、ハイブリッド検索、再ランク付け、ハルシネーション検出といったより高度な構成要素に至るまで、DIY RAGのすべてについて学んだ。第4章では、DIY RAGアプリケーションを単純な概念実証から本番環境での完全なデプロイへと移行させる作業が、当初思われるよりも複雑になりがちな理由を探り、実世界でのRAGのスケーリングに伴う主な課題を浮き彫りにし、本番環境でのDIYデプロイを成功させるための手順を提案した。

の「RAGプラットフォーム」(RAG-as-a-serviceやターンキーRAGとも呼ばれる)とは、開発者向けAPIの背後で、RAG構成要素のすべてではないにせよ大部分を実装する技術プラットフォームを指す。これにより、RAG構築に伴う複雑さの多くが抽象化され、開発者は代わりにRAGアプリケーションそのものに集中できるようになる。つまり、レスポンスをどのデータに基づかせるべきか、またアプリケーションを自社のビジネスやアプリケーションフローにどのように統合するかといった点に注力できるのだ。

この章では、RAGプラットフォームが何を提供するのか、そしてニーズに最適なプラットフォームをどのように選ぶかについて解説する。Vectaraを用いて、そのようなプラットフォームの使用方法を実演する。

DIYとプラットフォーム型RAG

、DIYのRAGスタックを構築する場合、RAGパイプラインの各構成要素を細かく制御できる。これには、ベクトルデータベース(例:Pinecone、Weaviate、Zilliz、 Qdrant)の選択と設定、任意の埋め込みモデル(例:CohereのEmbed v4 やQwen3-Embedding-0.6B )のホスティングと提供、チャンキング戦略の定義と実装、そしてLLM生成プロセスのカスタマイズが含まれる。

RAGスタックをカスタマイズする力は開発者にあるが、基盤となるインフラのプロビジョニング、統合、スケーリング、保守の責任もまた開発者にある。

対照的に、RAGプラットフォームは、インフラの複雑さを抽象化した、管理されたエンドツーエンドのソリューションを提供する。開発者はAPIを通じてサービスとやり取りし、データソースからデータを取り込み、検索パイプラインを選択・設定し、埋め込みモデルや生成モデルを選択し、最小限の設定でRAGアプリケーションをデプロイできる。

まさにこのインフラのオーバーヘッドからの解放こそが、RAGプラットフォームの優位性である。DIYアプローチでは、サーバのプロビジョニング、ベクトルDBの最適化、高可用性と低遅延の確保、各構成要素のセキュリティ更新管理といった非中核的なタスクに多大な労力を費やすことになる。 RAGプラットフォームプロバイダーはこうした運用上のオーバーヘッドを引き受けるため、ユーザーはアプリケーションロジックの構築とエンドユーザへの価値提供に専念できる。これにより、開発サイクルの短縮、DevOpsの作業負荷の軽減、そしてサービスが従量課金制やサブスクリプション方式で提供されることが多いため、初期のインフラコスト削減も期待できる。

さらに、RAGプラットフォームには、大規模なRAGシステムの管理におけるプロバイダーの専門知識を活用し、低遅延、高精度、および費用対効果を実現するための最適化機能が組み込まれていることが多い。RAGプラットフォームプロバイダーは、データソースコネクタ、高度な監視および可観測性、さらにはセキュリティやプライバシーのコンプライアンスといった機能を標準で提供する場合もあるが、これらを自作環境で再現するには多大なエンジニアリングの労力が必要となる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

The Human Factor in AI-Based Decision-Making

The Human Factor in AI-Based Decision-Making

Philip Meissner, Christoph Keding
What Successful Project Managers Do

What Successful Project Managers Do

W. Scott Cameron, Jeffrey S. Russell, Edward J. Hoffman, Alexander Laufer

Publisher Resources

ISBN: 0642572397647