第10章. 自律型バックグラウンド・コーディング・エージェント
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
自律型バックグラウンド・コーディング・エージェントは、AIコーディング・ツールの次の進化として急速に台頭してきている。 あなたがタイプしている間にコードを提案するおなじみの「副操縦士」アシスタントとは異なり、これらの演算子は、非同期にタスク全体を処理するために派遣できるバックグラウンドのジュニア開発者のように動作する。コードはエージェントのためにスピンアップされた隔離された環境で生成され、テストを実行することができ、その結果は多くの場合、あなたがレビューできるように完全に形成されたプルリクエストとして戻ってくる。
このセクションでは、バックグラウンド・コーディング・エージェントとは何か、どのように機能するのか、現在のツールの状況(OpenAI Codex、Google Jules、Cursor、Devinなど)、そして従来のIDEアシスタントとの比較可能性について探る。また、それらの能力、限界、そしてソフトウェアエンジニアリングの将来に向けた実用的な変化についても考察する。
コパイロットから自律型エージェントへ:バックグラウンド・コーディング・エージェントとは何か?
従来のAIコーディングアシスタント(Cursor、GitHub Copilot、ClineのようなVSCode拡張機能)は、監視されたコーディングエージェントであり、開発者のプロンプトやインラインコンテキストに応答する対話型ヘルパーである。これらは基本的にステロイドのオートコンプリートであり、チャットや執筆中にサジェストを生成するが、人間の開発者が運転席ですべてのステップをガイドする。
対照的に、自律型バックグラウンド・コーディング・エージェントは、はるかに大きな独立性を持って動作する。あなたは彼らに高レベルのタスクや目標を与え、その後「送り出し」、常に監視することなく、彼ら自身で問題を解決する。これらのエージェントは、あなたのコードベースを読み取り、修正し、計画を立て、コードを実行し(テストやコマンドを実行することもある)、結果(多くの場合、コミットやプルリクエスト)を出す-すべて非同期ワークフローで。
副操縦士(GitHub Copilotのようなもの)は常にコックピットにいて、あなたの入力を待っている。この自律性により、バックグラウンドエージェントは、あなたが他のことに集中している間、マルチステップのコーディングタスクに取り組むことができる。 CodexやJulesのような非同期エージェントを使うことは、、認知帯域幅を広げるようなものだ。AIにタスクを送り、それが終わるまで忘れていられる。AIとシングルスレッドでやりとりする代わりに、突然マルチスレッドのワークフローを手に入れることができる。エージェントは、バックグラウンドで働く有能なジュニア開発者のように、あなたと並列性で働く。
重要なのは、バックグラウンド・エージェントは、あなたのinterditorではなく、隔離された開発環境(多くの場合、クラウドの仮想マシンやコンテナ)で動作するということだ。彼らは通常、あなたのリポジトリをサンドボックス化し、依存関係をインストールし、プロジェクトのビルドとテストに必要なツールを持つ。セキュリティのため、これらのサンドボックス化は制限され(「明示的に許可されない限りインターネットにアクセスできない」といった規則がある)、エフェメラルである。エージェントは、あなたのローカルマシンにリスクを与えることなく、コンパイラ、テスト、リンターなどを実行することができる。タスクが完了すると、エージェントはコードの変更点(差分)とその概要を出力する。通常、これはプルリクエスト(コード差分、コミットメッセージ、場合によっては説明を含む)として出力され、あなたはそれをレビューしてマージすることができる。 ...