Skip to Content
生産性のためのハンズオンRAG (Japanese Edition)
book

生産性のためのハンズオンRAG (Japanese Edition)

by Ofer Mendelevitch, Forrest Sheng Bao
May 2026
358 pages
5h 53m
Japanese
O'Reilly Media, Inc.
Content preview from 生産性のためのハンズオンRAG (Japanese Edition)

第10章 RAGの未来

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

RAGは、LLMsを企業のプライベートデータに適用する上で、間違いなく最も影響力のあるアプローチの一つだ。ここ数年で、RAGは実験的なテクニックから、自社のデータに基づいたChatGPTのような体験を必要とする企業にとっての標準的なアーキテクチャパターンへと進化し、現在はPOCから本番環境へのデプロイへと急速に移行している。

本書を通じて、読者はRAGの柱であるLLMs、エンベディング、ベクトルストア、再ランク付けを習得した。また、機能的な概念実証がたった1週末で実現する様子も見てきた。しかし、ローカルスクリプトから堅牢な本番環境向けエコシステムへの飛躍こそが、真のエンジニアリングの始まりである。これには、「動く」という段階を超え、遅延、大規模な環境での精度、そして長期的な保守性の解決が求められる。

本番環境向けのRAGは単なるコードの問題ではない。厳格なガバナンスとセキュリティを必要とする分散システムである。 テラバイト規模のマルチモーダルコンテンツ全体でデータの整合性を確保しつつ、大規模なデータ取り込みを管理しなければならない。さらに重要なのは、多層防御のセキュリティ戦略を実装することだ。つまり、モデルに到達する前にPIIを削除するためのエンティティ認識型レダクションを展開し、ジュニアアナリストが機密性の高い人事文書を取得できないよう厳格なロールベースのアクセス制御を適用し、SOC 2、GDPR、HIPAAなどのコンプライアンス基準を満たすための包括的な監査証跡を維持することである。

セキュリティ以外にも、総所有コストという運用上の現実に対処する必要があり、ベンダー統合の複雑さを管理し、デカップリングされたマイクロサービスを用いて遅延を最適化し、ML、DevOps、セキュリティのギャップを埋めることができる多分野にわたるチームを編成しなければならない。

ここまでで、RAGの仕組み、各構成要素の役割、そしておそらく最も重要な点として、落とし穴がどこにあるかについて、深く理解していただけたことを願っている。しかし、生成AIの分野では状況が絶えず変化しており、毎週のように新しいテクニック、論文、ベンダの発表が次々と飛び込んでくる。何が意味のあるアーキテクチャの転換であり、何が単なる「一過性の流行」やベンダのマーケティングに過ぎないかを判別するのは、往々にして困難だ。

この最終章では、将来を見据え、ノイズから本質的な情報を引き分け、次世代のRAGを定義する有意義なトレンドに関する我々の洞察を提供する。1

リトリーバルの進化

検索レイヤーはもはや静的なユーティリティではなく、急速に進化する最前線である。「十分」な検索の時代を超え、精度の新たな基準へと移行するにつれ、検索パイプラインを構成する基盤構成要素は改善され続けている。

レイトやり取り埋め込み
標準的な埋め込みモデルは、ドキュメントのチャンクを単一の埋め込みベクトルに圧縮する。ColBERTのような「レイトインタラクション」モデルは、すべてのトークンに対してベクトルを保持し、最終的な埋め込み計算をクエリフェーズまで遅らせる。これにより、よりきめ細かな一致が可能になり、全体的な精度が向上することが多いが、その代償として、より高いストレージとメモリ要件が必要となる。2
ニュアンスを捉える再ランク付けモデル

(従来の再ランク付けモデルと比較して)全般的に精度が向上しているだけでなく、 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

The Human Factor in AI-Based Decision-Making

The Human Factor in AI-Based Decision-Making

Philip Meissner, Christoph Keding
What Successful Project Managers Do

What Successful Project Managers Do

W. Scott Cameron, Jeffrey S. Russell, Edward J. Hoffman, Alexander Laufer

Publisher Resources

ISBN: 0642572397647