第2章:どこまでLLMに任せるか
― 創発 × 伴走 / 非創発 × 自律 の境界線
AIエージェントを実装するときに最初にぶつかる壁が、
「AIってどこまで自分で考えさせていいの?」
という問題だ。
答えはシンプルだが、 99%のプロダクトがこれを間違えて破綻している。
2.1 創発と非創発 ― AIが得意なこと・苦手なこと
AIのタスクは、構造的に 2種類に分かれる。
- 創発タスク:答えが固定されていないもの
- 非創発タスク:答えと手順が固定されているもの
■ 創発タスク(Emergent Task)
- 設計
- 要件の構造化
- 問題の定義
- 新しい視点の提示
- 仮説生成
- 問題分析
- 文章構造化
LLMの本職 思考・構造化・視点生成が得意。
しかし…
自律的に実行までやらせると破綻する。
破綻例(Devinで多発した現象)
- 無限ループ
- 自分で壊したコードを直そうとし続ける
- 誤読した前提を延々と修正しようとする
- 関係ない調査を始める
- 最適化より手数を増やす
創発 × 自律 → 壊れる 理由:探索空間が無限に広がるから。
■ 非創発タスク(Non-Emergent Task)
- API呼び出し
- データ集計
- 検索
- ファイル生成
- スケジューラ実行
- バッチ処理
- 評価関数の適用
手順が決まっているタスク LLMに考えさせる必要がない。
非創発タスクは 自律化すればするほど安定する。
2.2 「創発 × 伴走」が唯一の安定構造
ではどうすべきか?
答えは次のマトリクスだ。
| 伴走(Human-in-the-loop) | 自律(Autonomous) | |
|---|---|---|
| 創発タスク | ◎ 最適 | × 破綻しやすい |
| 非創発タスク | ○ 問題ない | ◎ 最強 |
つまり:
創発タスクは伴走させる (LLMに判断をさせ、人間が方向性を修正)
非創発タスクは自律で回す (API・MCPに任せ、LLMは計画だけ)
2.3 なぜ創発は伴走型にすべきなのか?
理由はたった1つ。
創発は評価関数が存在しないタスクだから
プログラムが学習できるのは、 「正しいかどうかを判定する関数」がある場合だけだ。
創発タスクは正解が無い。
- 適切な仕様とは?
- いい文章とは?
- ベストな設計とは?
- 目的にあう構造とは?
これらに正解はないから、 AIは間違った方向に行っても気づけない。
→ 人間が"方向を固定"する役割が絶対必要。
2.4 非創発 × 自律 の最適化が「レポート化」
非創発は全て 「事前計算」に落とせる。
具体的には:
- バッチで全部計算
- レポートとして永続化
- LLMはそれを読むだけ
これにより
- レイテンシ → ミリ秒
- コスト → 計算1回だけ
- 再現性100%
- 揺れゼロ
AIがぶっ壊れる余地がなくなる。
2.5 タスクを実装する前に必ず判定すべき3問
あなたが実装者なら、 タスクを見た瞬間に次を判定すべきだ。
- これは創発?
- 創発なら伴走にする?
- 非創発なら自律にする?
たったこれだけで エージェントの生存率が一桁上がる。
2.6 エージェント破綻の90%は「分類ミス」
次のような失敗はすべて分類ミスから起きる。
- LLMにコードを書かせ続けて壊れる
- LLMにAPIを勝手に叩かれて暴走
- LLMが意図しない調査を始めた
- 質問ごとに別の答えが返ってくる
- 意味不明な探索を繰り返す
ほぼすべて、
創発タスクを自律にしたから
で説明できる。
2.7 実装者の心得:AIは「プログラム」ではない
プログラマがAIでつまずく最大の理由はこれだ。
AIを"ロジックツリーで動くもの"として扱ってしまう。
AIはロジックではなく「パターン」で動く。
だから、実行手順をAIに書いてはいけない。
AIに渡すべきは手順ではなく、
- 役割
- 視点
- 判断基準
- 価値観
- 制約
- 成功の定義
だけ。
それ以外は全部ツールで外部化。
2.8 まとめ
- 創発タスクは必ず伴走
- 非創発タスクは自律化(レポート化)
- AIに実行させると破綻
- 人間は方向性の"スナップポイント"
- LLMには判断・構造化だけを任せる
この章は実装上の最重要基礎。ここを理解していないエージェントはすべて壊れる。
Last Updated: 2025-12-07