第3章. 知識を加える:ベース
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
基盤モデルは、トレーニングデータによって制限されるクローズドシステム 。多くの場合、基盤モデルに追加情報を与える必要がある。例えば、その情報は、基盤モデルのトレーニング時には発生していなかった最近の出来事をベースモデルにしていたり、その情報が機密情報であったり、基盤モデルのトレーナーにとって利用できないものであったりする。
LLMに知識を追加して再トレーニングを行ったり、基礎モデルに知識を追加するために継続的な事前トレーニング(CPT)を行ったりすることは非現実的である。1回のトレーニングにかかるコストでさえ大きい。また、情報の変化は非常に速いため、CPTは頻繁に行わなければならない。これらのコストは、数千万ドルに上ることもある、1そのため、通常は基盤モデルをそのまま使用し、実行時に知識を追加することを望むだろう。
実行時に基盤モデルに追加情報を提供するために使われる重要なパターンは、 、フェイスブックAIリサーチ(現在はMetaの一部)で働く研究者たちによって2020年に発表された画期的な論文「Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks」で紹介された。RAG(検索拡張生成)は、基盤モデルを、トレーニングデータによって制限されるクローズドなシステムから、オンデマンドで外部の知識を活用できるオープンなシステムへとトランスフォーマー化する。
RAGは、3つのステップ(索引付け、検索、生成)からなる構成要素として考えるのが最適であり、デプロイする必要があるが、その構成要素はかなりカスタマイズ可能である。そのため、本書の他の章とは異なり、自分の問題に最も適したパターンを選ぶのではなく、本章のすべてのパターンを順番に読むことを推奨する(図3-1参照)。
本章のパターンは、高度化する要件を処理するために使用できる機能を追加しながら、互いに構築し合っている。ボックスはパターンであり、矢印は、洗練度を上げて次のパターンに進む理由を示している。たとえば、無関係なコンテンツや曖昧さなどを処理する必要がある場合は、パターン9からパターン10に進むことができる。
とはいえ、システムを構築するために、ここで紹介するすべてのアイデアが必要になるわけではない。どれが必要かは、あなたのシステムが何のためにあるのかによって変わってくる。(専門家向けの社内ツールなのか、それとも何百万人もの顧客が使う製品なのか)。また、本章のアイデアで扱われる問題が、RAGシステムが遭遇する質問やドキュメントのタイプに関連しているかどうかにもよる。
パターン 6: 基本的な RAG
Basic RAGパターンでは、システム 、インデックス作成、検索、生成の3つのコアステップで構成される。この章で取り上げるBasic RAGパターンをそのまま採用することはあまり期待しないが、かなり単純化された実装の限界が、この章の他のパターンの正当性を示している。実装を複雑にしすぎないように、より高度なテクニックの理由とトレードオフを理解することが重要である。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access