第5章:創発タスクと非創発タスクの境界線
― Devinでさえ破綻する領域と、最初からAIに任せるべきでない領域
AIエージェントの設計で、最も誤解が多い部分がある。
「AIに任せれば自律的に問題を解いてくれるはずだ」 という期待。
残念ながらこれは正しくない。 むしろ、多くの失敗はここから生まれている。
AIがうまく働く領域と、働きづらい領域には、 構造的に明確な境界線がある。
その境界の名前が 創発性 だ。
創発タスクとは何か?
創発タスクとは、 「答えが事前に決まっていない問題」のことだ。
- 新しいサービスアイデアを考える
- まだ整理されていない市場を評価する
- 曖昧な要件から構造を設計する
- 前例のない障害原因を推測する
- 新しい研究仮説を生成する
ここでは、 "やるべきこと" そのものが問題を解きながら変化していく。
つまり、判断の文脈が固定できない。
LLMはこれが得意だ。 巨大モデルに蓄積されたパターンから、 多様なアイデアや視点を引き出すことができる。
ただし—— 得意なのは「発想」や「観察」、つまり 生成的な部分だけ だ。
非創発タスクとは何か?
一方、非創発タスクとは、
「やるべきことが事前に決まっており、手順も安定している」 領域だ。
- データ集計
- 相関分析
- 異常検知
- API呼び出し
- スクリプト生成
- 書類の下書き
- チェックリスト評価
ここには「驚き」はいらない。 求められるのは正確さ、安定性、一貫性だ。
AI設計で重要なのは「創発に任せる部分を最小化する」こと
AIに任せてよい創発は "判断の補助" のみ。 実行は外に出し、安定させるべき。
ところがよくある失敗はこうだ:
❌ 創発 × 自律 × タスク実行
→ AIがタスクを自分で決め、自分で実行し、自分で評価する → ループ・暴走・無意味な探索・コスト爆発
これは現在の技術で最も破綻しやすい構造だ。
象徴的なのが Devin問題 である。
Devinが示した限界 ― 「創発 × 自律」はまだ難しい
Devinは「AIソフトウェアエンジニア」を自称した最初の大規模プロジェクトだった。 驚くべき能力を示す一方で、次のような問題も頻発した。
- 無限ループ
- 不必要な探索
- 自分で壊したコードを直し続ける
- "正しそうに見える"が実際は動かない修正
- パフォーマンスの悪い手順を延々と試す
これは設計パターンが悪いのではなく、 創発性を完全自律で回すこと自体が、構造的に難しい ことを示している。
理由は明確だ。
創発タスクには「ルール不定」「探索の無限性」が内在するから。 人間のソフトウェアエンジニアでさえ、 経験・規律・制約・メンタルモデルで探索空間を絞っている。 AIにはそれがない。
現時点で唯一安定するのは「創発 × 伴走」の構造
創発は、AIの強みである。 新しい視点やバリエーションを生成できる。
ただし、それを 制御するのは人間の役割 だ。
- 「方向がズレている」
- 「これは意味が薄い」
- 「この方針は採用しない」
こうした調整点を、人間が1ミリでも挟むと、 創発の暴走は瞬間的に止まる。
この構造を私は 伴走型 と呼んでいる。
3つの構造
- 創発 × 伴走 → 実装可能
- 創発 × 自律 → 破綻しやすい
- 非創発 × 自律 → 実務で最も強い
この3区分は、AIエージェント設計の根幹になる。
「創発が必要か?」は設計前に必ず判定するべき
タスクを見たら、最初にやるべきことはこれだ。
- 創発が必要?
- それは自律で回せる?
- 回せないなら伴走にする?
- 伴走ならタスク範囲を固定して文脈を守る?
多くの現場で起きている混乱は、 この判定をしていないことに起因している。
非創発タスクは「リスト化」と「事前計算」が最適解
非創発タスクのほとんどは、 実は「既知の分析・操作のパターン」に過ぎない。
それは次章で扱う レポート化アーキテクチャ につながっていく。
- データ分析は創発ではない
- パターンカタログを網羅的に適用すれば終わる
- だからリアルタイムAIは必要ない
- バッチで計算し、レポートとして永続化すればよい
創発タスクと非創発タスクを分けて考えると、 この構造が非常にクリアになる。
(追記)伴走型と自律型 ― 創発と安定性を決めるもうひとつの軸
創発タスクかどうかを判定した後、 もうひとつ考えるべき軸がある。
それが 伴走型(Co-pilot) と 自律型(Autonomous) の構造だ。
これは技術の話ではなく、 「誰が判断の主語になるか」という設計思想の話だ。
伴走型(Co-pilot)とは何か
伴走型のエージェントは、
- AIはアイデアを出す
- 人間が方向性を決める
- 判断は人間の側にある
- AIは"補助エンジン"として動く
という構造をとる。
創発タスクは本質的に曖昧だ。 方向性が揺れ、探索空間が広がり続ける。
この不安定さを収束させてくれるのが「人間の一声」である。
1回人間がチェックするだけで、創発の暴走は止まる。 これが伴走型の強さだ。
自律型(Autonomous)とは何か
一方、自律型は
- AI自身がタスクを決め
- AI自身が実行し
- AI自身が評価する
という"完全自走モード"である。
非創発タスク(定型処理)では非常に強い。
しかし創発タスクを自律型で扱うと—— 探索空間が無制限に広がり、ループや暴走が発生しやすい。
Devinが示した限界は、この構造的な性質に起因する。
伴走型と自律型の違い
伴走型(Co-pilot)
AIは「アイデアや視点」を出し、人間が方向性を決める構造。
- 創発との相性: ◎(人間が収束させる)
- 判断の主語: 人間
- タスク決定: 人間
- 探索空間: 制限される
- 安定性: 高い
- 必要な構造: 文脈の純度・チェックポイント
- 典型の失敗: ほぼ発生しない
- 最適領域: 創発タスク(曖昧な問題・新規課題)
創発タスクは、たった一度の人間の介入で方向性が収束する。 その安定性の高さが、伴走型の強みだ。
自律型(Autonomous)
AIが自分で方針を決め、実行し、評価する完全自走型。
- 創発との相性: ×(暴走しやすい)
- 判断の主語: AI
- タスク決定: AI
- 探索空間: 無限に広がる
- 安定性: 低い(ループしやすい)
- 必要な構造: 強制ルール・制約
- 典型の失敗: Devin問題・過剰探索
- 最適領域: 非創発タスク(定型処理・手順明確)
非創発タスクなら、 自律型は極めて強い。
3行でまとめると、こうなる
- 創発 × 伴走 → 実務で最も強い
- 非創発 × 自律 → 安定性が高い
- 創発 × 自律 → 現時点では破綻しやすい
この3つは、エージェント設計の設計思想を決める"軸"になる。
次章への橋渡し:非創発 × 自律の最適解が「レポート化」になる
非創発タスクの大半はすでにパターン化されている。 創発を必要としない。 つまり自律型で安定運用できる。
そして非創発 × 自律の最適解が、 次章で扱う 「レポート化アーキテクチャ」 である。
この章のまとめ
- AIに向いているのは「創発=判断の補助」であって「自律的な問題解決」ではない
- 創発 × 自律は現時点の技術では破綻しやすい
- Devin問題が示したのは、創発の無限性をAI単体では制御できないこと
- 非創発タスクは手順が固定しており、外部化・テンプレート化・事前計算が最適
- 設計前に:創発か?自律か?人間は入るか?を必ず判定する
次章(第6章)は、 データ分析の本丸:レポート化アーキテクチャ に進む。
ここでシリーズ全体の"実務的インパクト"が最大化される。
Last Updated: 2025-12-04