Skip to content

第2章:どこまでLLMに任せるか

― 創発 × 伴走 / 非創発 × 自律 の境界線

AIエージェントを実装するときに最初にぶつかる壁が、

「AIってどこまで自分で考えさせていいの?」

という問題だ。

答えはシンプルだが、 99%のプロダクトがこれを間違えて破綻している。


2.1 創発と非創発 ― AIが得意なこと・苦手なこと

AIのタスクは、構造的に 2種類に分かれる。

  • 創発タスク:答えが固定されていないもの
  • 非創発タスク:答えと手順が固定されているもの

■ 創発タスク(Emergent Task)

  • 設計
  • 要件の構造化
  • 問題の定義
  • 新しい視点の提示
  • 仮説生成
  • 問題分析
  • 文章構造化

LLMの本職 思考・構造化・視点生成が得意。

しかし…

自律的に実行までやらせると破綻する。

破綻例(Devinで多発した現象)

  • 無限ループ
  • 自分で壊したコードを直そうとし続ける
  • 誤読した前提を延々と修正しようとする
  • 関係ない調査を始める
  • 最適化より手数を増やす

創発 × 自律 → 壊れる 理由:探索空間が無限に広がるから。


■ 非創発タスク(Non-Emergent Task)

  • API呼び出し
  • データ集計
  • 検索
  • ファイル生成
  • スケジューラ実行
  • バッチ処理
  • 評価関数の適用

手順が決まっているタスク LLMに考えさせる必要がない。

非創発タスクは 自律化すればするほど安定する。


2.2 「創発 × 伴走」が唯一の安定構造

ではどうすべきか?

答えは次のマトリクスだ。

伴走(Human-in-the-loop)自律(Autonomous)
創発タスク◎ 最適× 破綻しやすい
非創発タスク○ 問題ない◎ 最強

つまり:

  • 創発タスクは伴走させる (LLMに判断をさせ、人間が方向性を修正)

  • 非創発タスクは自律で回す (API・MCPに任せ、LLMは計画だけ)


2.3 なぜ創発は伴走型にすべきなのか?

理由はたった1つ。

創発は評価関数が存在しないタスクだから

プログラムが学習できるのは、 「正しいかどうかを判定する関数」がある場合だけだ。

創発タスクは正解が無い。

  • 適切な仕様とは?
  • いい文章とは?
  • ベストな設計とは?
  • 目的にあう構造とは?

これらに正解はないから、 AIは間違った方向に行っても気づけない。

人間が"方向を固定"する役割が絶対必要。


2.4 非創発 × 自律 の最適化が「レポート化」

非創発は全て 「事前計算」に落とせる。

具体的には:

  1. バッチで全部計算
  2. レポートとして永続化
  3. LLMはそれを読むだけ

これにより

  • レイテンシ → ミリ秒
  • コスト → 計算1回だけ
  • 再現性100%
  • 揺れゼロ

AIがぶっ壊れる余地がなくなる。


2.5 タスクを実装する前に必ず判定すべき3問

あなたが実装者なら、 タスクを見た瞬間に次を判定すべきだ。

  1. これは創発?
  2. 創発なら伴走にする?
  3. 非創発なら自律にする?

たったこれだけで エージェントの生存率が一桁上がる。


2.6 エージェント破綻の90%は「分類ミス」

次のような失敗はすべて分類ミスから起きる。

  • LLMにコードを書かせ続けて壊れる
  • LLMにAPIを勝手に叩かれて暴走
  • LLMが意図しない調査を始めた
  • 質問ごとに別の答えが返ってくる
  • 意味不明な探索を繰り返す

ほぼすべて、

創発タスクを自律にしたから

で説明できる。


2.7 実装者の心得:AIは「プログラム」ではない

プログラマがAIでつまずく最大の理由はこれだ。

AIを"ロジックツリーで動くもの"として扱ってしまう。

AIはロジックではなく「パターン」で動く。

だから、実行手順をAIに書いてはいけない。

AIに渡すべきは手順ではなく、

  • 役割
  • 視点
  • 判断基準
  • 価値観
  • 制約
  • 成功の定義

だけ。

それ以外は全部ツールで外部化。


2.8 まとめ

  • 創発タスクは必ず伴走
  • 非創発タスクは自律化(レポート化)
  • AIに実行させると破綻
  • 人間は方向性の"スナップポイント"
  • LLMには判断・構造化だけを任せる

この章は実装上の最重要基礎。ここを理解していないエージェントはすべて壊れる。


Last Updated: 2025-12-07

Code: MIT / Content: CC BY-SA 4.0