第2章：どこまでLLMに任せるか

― 創発 × 伴走 / 非創発 × 自律の境界線

AIエージェントを実装するときに最初にぶつかる壁が、

「AIってどこまで自分で考えさせていいの？」

という問題だ。

答えはシンプルだが、 99%のプロダクトがこれを間違えて破綻している。

2.1 創発と非創発 ― AIが得意なこと・苦手なこと

AIのタスクは、構造的に 2種類に分かれる。

創発タスク：答えが固定されていないもの
非創発タスク：答えと手順が固定されているもの

■ 創発タスク（Emergent Task）

設計
要件の構造化
問題の定義
新しい視点の提示
仮説生成
問題分析
文章構造化

LLMの本職 思考・構造化・視点生成が得意。

しかし…

自律的に実行までやらせると破綻する。

破綻例（Devinで多発した現象）

無限ループ
自分で壊したコードを直そうとし続ける
誤読した前提を延々と修正しようとする
関係ない調査を始める
最適化より手数を増やす

創発 × 自律 → 壊れる 理由：探索空間が無限に広がるから。

■ 非創発タスク（Non-Emergent Task）

API呼び出し
データ集計
検索
ファイル生成
スケジューラ実行
バッチ処理
評価関数の適用

手順が決まっているタスク LLMに考えさせる必要がない。

非創発タスクは自律化すればするほど安定する。

2.2 「創発 × 伴走」が唯一の安定構造

ではどうすべきか？

答えは次のマトリクスだ。

	伴走（Human-in-the-loop）	自律（Autonomous）
創発タスク	◎ 最適	× 破綻しやすい
非創発タスク	○ 問題ない	◎ 最強

つまり：

創発タスクは伴走させる （LLMに判断をさせ、人間が方向性を修正）
非創発タスクは自律で回す （API・MCPに任せ、LLMは計画だけ）

2.3 なぜ創発は伴走型にすべきなのか？

理由はたった1つ。

創発は評価関数が存在しないタスクだから

プログラムが学習できるのは、「正しいかどうかを判定する関数」がある場合だけだ。

創発タスクは正解が無い。

適切な仕様とは？
いい文章とは？
ベストな設計とは？
目的にあう構造とは？

これらに正解はないから、 AIは間違った方向に行っても気づけない。

→ 人間が"方向を固定"する役割が絶対必要。

2.4 非創発 × 自律の最適化が「レポート化」

非創発は全て 「事前計算」に落とせる。

具体的には：

バッチで全部計算
レポートとして永続化
LLMはそれを読むだけ

これにより

レイテンシ → ミリ秒
コスト → 計算1回だけ
再現性100%
揺れゼロ

AIがぶっ壊れる余地がなくなる。

2.5 タスクを実装する前に必ず判定すべき3問

あなたが実装者なら、タスクを見た瞬間に次を判定すべきだ。

これは創発？
創発なら伴走にする？
非創発なら自律にする？

たったこれだけで エージェントの生存率が一桁上がる。

2.6 エージェント破綻の90%は「分類ミス」

次のような失敗はすべて分類ミスから起きる。

LLMにコードを書かせ続けて壊れる
LLMにAPIを勝手に叩かれて暴走
LLMが意図しない調査を始めた
質問ごとに別の答えが返ってくる
意味不明な探索を繰り返す

ほぼすべて、

創発タスクを自律にしたから

で説明できる。

2.7 実装者の心得：AIは「プログラム」ではない

プログラマがAIでつまずく最大の理由はこれだ。

AIを"ロジックツリーで動くもの"として扱ってしまう。

AIはロジックではなく「パターン」で動く。

だから、実行手順をAIに書いてはいけない。

AIに渡すべきは手順ではなく、

役割
視点
判断基準
価値観
制約
成功の定義

だけ。

それ以外は全部ツールで外部化。

2.8 まとめ

創発タスクは必ず伴走
非創発タスクは自律化（レポート化）
AIに実行させると破綻
人間は方向性の"スナップポイント"
LLMには判断・構造化だけを任せる

この章は実装上の最重要基礎。ここを理解していないエージェントはすべて壊れる。

Last Updated: 2025-12-07

第2章：どこまでLLMに任せるか ​

― 創発 × 伴走 / 非創発 × 自律 の境界線 ​

2.1 創発と非創発 ― AIが得意なこと・苦手なこと ​

■ 創発タスク（Emergent Task） ​

破綻例（Devinで多発した現象） ​

■ 非創発タスク（Non-Emergent Task） ​

2.2 「創発 × 伴走」が唯一の安定構造 ​

2.3 なぜ創発は伴走型にすべきなのか？ ​

2.4 非創発 × 自律 の最適化が「レポート化」 ​

2.5 タスクを実装する前に必ず判定すべき3問 ​

2.6 エージェント破綻の90%は「分類ミス」 ​

2.7 実装者の心得：AIは「プログラム」ではない ​

AIに渡すべきは手順ではなく、 ​

2.8 まとめ ​