
185
5-4:LLM-as-Agent
1
2
3
4
5
6
5
要がある。電気スタンドは机1~2、サイドテーブル1~2、
棚1~6、ベッド、引き出し1~6に見つかる可能性が高い。
手始めに机1からひとつずつチェックせよ。
行動:机1へ移動せよ。
途中経過は省くが、この最初の試行でAI エージェントは机の上にマ
グカップと電気スタンドを見つけることができたものの、マグカップ
に気を取られ、そこにあった電気スタンドをうまく使うことができな
かった。シミュレータ上で無効な行動が既定回数繰り返されたとき、
タスクは失敗したとみなされるように設計されている。
行動:電気スタンドを使用せよ。
何も起こらなかった。
行動:電気スタンドを使用せよ。
何も起こらなかった。
失敗
試行が失敗と評価された、ここからがReflextionの本領発揮だ。こ
うした一連の行動とその結果を内省し、言語化する。
この環境において、私の当初の計画はマグカップを見つけてから
行動生成(モデルの応答)
環境(シミュレータが入力するプロンプト)
行動生成(モデルの応答)
環境(シミュレータが入力するプロンプト)
状態(モデルの応答)
内省(モデルの応答)