
159
:
1
2
3
4
5
6
5
前章までは大規模言語モデルの推論能力を高めるためのプロンプト
パターンについて紹介してきた。それらは、ある特定の思考パターン
のトリガーとなるプロンプトを用いることで、モデルが行う推論がデ
タラメな方向に漂流したりハルシネーションを起こしたりするのを防
ぎ、モデルが持つ知識や推論能力を最大限に引き出すためのアプロー
チだった。
この第5章では、大規模言語モデルを使いこなす上での、より発展
的な技術について見ていこう。それらは複数のモデルを用いたり、あ
るいは他のソフトウェアと連動したり、ドメイン知識や記憶のメカニ
ズムをモデルに統合することで、大規模言語モデルの能力を大きく拡
張する技術だ。それはもはやプロンプトパターンという技術的な枠組
みを超えた「アーキテクチャ」とでも呼ぶべきものかもしれない。
大規模言語モデルは膨大な量のデータを学習した結果、それ自身の
内部に測りしれない知識を蓄えている。その上で、大規模言語モデル
の外部に特別な記憶を持たせる動機には主に2つある。ひとつは事前
学習や追加学習の限界を超えて、モデルの知識や推論能力を拡張する ...