コーディングエージェントが実際どう動くか

みんなコーディングエージェントは魔法だと思ってる。プロンプト打って、コード出てくる。オートコンプリートの賢い版。

5分見てたら分かる：サブシステムのカオスが次に何するかで常に揉めてる。

知性の幻想

お前が聞く：「NextAuthで認証追加して。」

想像すること：AIが理解して、コード書く。

実際に起きること：

ルーターがプロンプト見て、どのモデルが処理するか決める
コンテキスト取得がコードベーススキャン、「関連」ファイル選ぶ
LLMが部分的コンテキストで計画生成
ツール実行がコマンド実行、ファイル編集
オーケストレーターが動いたかチェック
動いてないからステップ3に戻る

これは知性じゃない。より良い記憶力を持った試行錯誤だ。

コンテキスト問題

ほとんどのエージェントタスクを殺すのがこれ：

お前のコードベース: 50,000行
エージェントのコンテキストウィンドウ: 8,000トークン（〜2,000行）
エージェントが見るもの: コードの4%

エージェントがどの4%を見るか選ぶ。間違える？お前のパターンに合わないコード書く。持ってないライブラリ使う。規約無視。

エージェントがハマる理由

先週エージェントが機能追加しようとするの見てた。ループ回数：7。

試行1: importパス間違い
試行2: import直した、関数シグネチャ間違い
試行3: シグネチャ直した、依存関係忘れた
試行4: 依存関係追加、テスト壊れた
試行5: テスト直した、新しいバグ導入
試行6: バグ直した、importに戻った
試行7: ユーザー諦める

各試行がトークンかかる。時間かかる。エラーが複合する、エージェントは自分の失敗パターンが見えないから。

エージェントが実際に役立つとき

退屈で、よく定義されたタスク：

「このモデルのCRUDエンドポイント追加」— 動く
「この関数のテスト書いて」— 動く
「XをYにコードベース全体でリネーム」— 動く
「これをきれいにリファクタして」— 災害

パターン：解決策が明らかでスコープが狭いときエージェントは優秀。判断が必要なとき失敗する。

本当のワークフロー

動くもの：

1. タスクを小さい部分に分解
2. エージェントに一部分だけ与える
3. 出力をすぐレビュー
4. ミスは自分で直す
5. 繰り返し

エージェントは速いインターン、シニアエンジニアじゃない。そう扱え。

エージェントは賢くない。正しくなるまで間違うのが速いだけだ。

— blanho

みんなコーディングエージェントは魔法だと思ってる。プロンプト打って、コード出てくる。オートコンプリートの賢い版。

5分見てたら分かる：サブシステムのカオスが次に何するかで常に揉めてる。

知性の幻想

お前が聞く：「NextAuthで認証追加して。」

想像すること：AIが理解して、コード書く。

実際に起きること：

ルーターがプロンプト見て、どのモデルが処理するか決める
コンテキスト取得がコードベーススキャン、「関連」ファイル選ぶ
LLMが部分的コンテキストで計画生成
ツール実行がコマンド実行、ファイル編集
オーケストレーターが動いたかチェック
動いてないからステップ3に戻る

これは知性じゃない。より良い記憶力を持った試行錯誤だ。

コンテキスト問題

ほとんどのエージェントタスクを殺すのがこれ：

お前のコードベース: 50,000行
エージェントのコンテキストウィンドウ: 8,000トークン（〜2,000行）
エージェントが見るもの: コードの4%

エージェントがどの4%を見るか選ぶ。間違える？お前のパターンに合わないコード書く。持ってないライブラリ使う。規約無視。

エージェントがハマる理由

先週エージェントが機能追加しようとするの見てた。ループ回数：7。

試行1: importパス間違い
試行2: import直した、関数シグネチャ間違い
試行3: シグネチャ直した、依存関係忘れた
試行4: 依存関係追加、テスト壊れた
試行5: テスト直した、新しいバグ導入
試行6: バグ直した、importに戻った
試行7: ユーザー諦める

各試行がトークンかかる。時間かかる。エラーが複合する、エージェントは自分の失敗パターンが見えないから。

エージェントが実際に役立つとき

退屈で、よく定義されたタスク：

「このモデルのCRUDエンドポイント追加」— 動く
「この関数のテスト書いて」— 動く
「XをYにコードベース全体でリネーム」— 動く
「これをきれいにリファクタして」— 災害

パターン：解決策が明らかでスコープが狭いときエージェントは優秀。判断が必要なとき失敗する。

本当のワークフロー

動くもの：

1. タスクを小さい部分に分解
2. エージェントに一部分だけ与える
3. 出力をすぐレビュー
4. ミスは自分で直す
5. 繰り返し

エージェントは速いインターン、シニアエンジニアじゃない。そう扱え。

エージェントは賢くない。正しくなるまで間違うのが速いだけだ。

— blanho

コーディングエージェントが実際どう動くか

知性の幻想

コンテキスト問題

エージェントがハマる理由

エージェントが実際に役立つとき

本当のワークフロー

Related Posts

コーディングにおけるAIの3つの波

CLI vs MCP：AIエージェントはツールとどう話すべきか？

APIを叩くのをやめて自分のモデルを訓練しろ

コーディングエージェントが実際どう動くか

知性の幻想

コンテキスト問題

エージェントがハマる理由

エージェントが実際に役立つとき

本当のワークフロー

Related Posts

コーディングにおけるAIの3つの波

コーディングにおけるAIの3つの波

CLI vs MCP：AIエージェントはツールとどう話すべきか？

CLI vs MCP：AIエージェントはツールとどう話すべきか？

APIを叩くのをやめて自分のモデルを訓練しろ

APIを叩くのをやめて自分のモデルを訓練しろ

コーディングにおけるAIの3つの波

CLI vs MCP：AIエージェントはツールとどう話すべきか？

APIを叩くのをやめて自分のモデルを訓練しろ