Skip to Content
生産性のためのハンズオンRAG (Japanese Edition)
book

生産性のためのハンズオンRAG (Japanese Edition)

by Ofer Mendelevitch, Forrest Sheng Bao
May 2026
358 pages
5h 53m
Japanese
O'Reilly Media, Inc.
Content preview from 生産性のためのハンズオンRAG (Japanese Edition)

はじめに

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

「簡単なRAG」のデモを見たことがあるだろう。Pythonの数行、ベクトルデータベース、そしてAPIキー。10分もあれば、チャットボットが数枚の社内PDFファイルに基づいて質問に答え始める。まるで魔法のようだ。

もしかしたら、自社でも次のステップに進んだかもしれない。RAG(検索拡張生成)アプリケーションを構築し、お気に入りのクラウドプラットフォームでホストし、ナレッジベースを数百件のドキュメント規模に拡張したのだ。見た目も使い心地も「本物の」アプリケーションのようだ。

そして「2日目」がやってくる。

ユーザがより複雑な質問をし始めると、当初の「魔法」はほころび始める。RAGアプリケーションが、存在しない規制ポリシーを自信満々にハルシネーションしたり、特定のエンジニアリング図面ではなく一般的なマーケティングパンフレットを引用してトラブルシューティングを失敗させたりしたとき、亀裂が生じるのだ。 ステークホルダーが意見を述べ始めると、緊張が高まる。CIOはセキュリティとデータプライバシーに関する回答を要求し、一方、研究開発部門は、PDFファイルの奥深くに埋もれた重要なフローチャートや図表に対して、システムが依然として「盲目」であると報告する。

1,000件の文書では堅調だった検索精度は、その10倍や100倍のボリュームになると「意味論的ノイズ」へと溶けていくことに、すぐに気づくことになる。システムが拡大するにつれ、精度は低下し、本番トラフィックの負荷によって遅延は急上昇する。避けられない信頼性監査の要求が到来した時、あなたは厳しい現実に直面せざるを得なくなる。つまり、パイプラインのどの具体的な構成要素が実際に機能不全を起こしているかを診断するために必要な、再現性のあるメトリクス主導の評価フレームワークが欠如しているのだ。

これが「本番環境の壁」だ。これは、初期のRAG概念実証(POC)と、堅牢なエンタープライズグレードのAIアプリケーションとの間の溝である。これを乗り越えるには、単にプロンプトを改善するだけでは不十分だ。根本的な視点の転換が必要となる。

デモからエンタープライズ規模のアプリケーションへの移行は、干し草の山から針を発見することよりもはるかに困難だ。そこには、マルチモダリティによる複雑さへの対処、厳格な統計的信頼性の確保、そして分散型AIシステムの運用オーバーヘッドへの対応が求められる。多くのプロジェクトが失敗するのは、この規模を過小評価し、RAGを進化するエンジニアリング分野ではなく、単なる「プラグアンドプレイ」機能として扱ってしまうからだ。

本書の内容

多くの開発者は本番環境での壁にぶつかり、技術に欠陥があると決めつけてしまう。そうではない。問題は、デモを構築するために使われるテクニックと、エンタープライズ規模の製品を構築するために必要な要件が根本的に異なる点にある。

本書は、その溝を埋める架け橋となる。本番環境におけるRAG特有の運用上の課題に取り組む。この旅を終える頃には、読者は以下のことができるようになるだろう:

高精度な検索の実装

単純なベクトル検索を超え、ハイブリッド検索、関連性再ランク付け、またはナレッジグラフを活用し、エンタープライズ規模での複雑な質問に対する正確性を確保する。

ハルシネーションを排除する

検索を意識したガードレールを使用して、大規模言語モデル(LLM)の「ハルシネーション」を診断・低減すると同時に、RAGシステムがレスポンスの根拠として最新の企業データを確実に保有できるようにする。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

The Human Factor in AI-Based Decision-Making

The Human Factor in AI-Based Decision-Making

Philip Meissner, Christoph Keding
What Successful Project Managers Do

What Successful Project Managers Do

W. Scott Cameron, Jeffrey S. Russell, Edward J. Hoffman, Alexander Laufer

Publisher Resources

ISBN: 0642572397647