
3.8.1
ReActのプロンプトと処理手順
ReActでは、次の構成のプロンプトを使用します。
タスクの説明
利用可能なツールの説明
推論・行動・観測(Thought-Action-Observation)のフォーマット
利用可能なツールの説明では、関数のシグネチャやその仕様を与えます。推論・行動・観測
のフォーマットでは、LLMの出力(推論・行動)とLLM への入力(観測)の形式を指定します。
フォーマットの指定は、Few-Shotプロンプトで例示することで行われます。ただし、ツール
利用に対応しているLLM の場合は、例示を省略することもできます。
ReActの手順は次のとおりです。
1. プロンプトの作成:LLMに対して、タスクの説明や目標を含むプロンプトを与えます。
2. 目標を達成するまで、次のステップを繰り返します。
①推論(Thought):LLMはプロンプトに基づいて推論を行い、次の行動を決定します。
推論の内容は、タスクの分析、必要な情報の特定、行動の計画などが含まれます。
②行動(Action):エージェントは推論の結果に基づいて行動を実行します。行動には、
ツールの使用(例:Web検索、計算の実行など)や最終回答の生成などがあります。
③観測(Observation):エージェントは行動の結果を観測し、LLM にフィードバックし
ます。ツールを使用した場合はツールからの出力が観測となります。最終回答が生成
された場合は、タスクの実行が終了します。
④次の推論のためのプロンプトの更新:現在までの推論 ...