
エージェントとは
6.1
エージェントは環境と相互作用し、状況に応じて行動を選択するプログラムです。エージェ
ントは、環境からの入力を受け取り、その入力に基づいて行動を選択し、環境に対する出力を
生成します。
LLMはエージェントの有力な実装手段として注目され、数多くの研究が行われています。
最近の研究では、LLMを用いたエージェントが ReAct[Yao et al. 2023] やReflexion[Shinn et
al. 2023] などの手法により、複雑な推論やプランニング、ツールの活用を行えることが示され
ています。LLM ベースのエージェントに明確に定義があるわけではありません。しかし、多
くの場合エージェントは次のような特徴を持ちます。
脳、知覚、行動の三つの要素を持つ[Xi et al. 2023]
短期記憶・長期記憶を持ち、過去の情報を活用する[N. Liu et al. 2024]
エージェントは人間と同様に環境を認識し、思考し、行動する能力を持っています。ここで
いう「脳」は、エージェントの意思決定を担う中核部分であり、主にLLM が担当します。
LLMは、与えられた情報から適切な行動を推論するための知性を提供します。
「知覚」は、センサーやAPI などを通じて環境から情報を取得する機能です。知覚により
エージェントは環境の状態を認識することができます。環境から取得した情報をLLM のプロ
ンプトに組み込むことで、エージェントは知覚に基づく推論を行うことができます。
「行動」は、エージェントが環境に働きかけを行うための機能です。この機能にはツールの ...