第5章：創発タスクと非創発タスクの境界線

― Devinでさえ破綻する領域と、最初からAIに任せるべきでない領域

AIエージェントの設計で、最も誤解が多い部分がある。

「AIに任せれば自律的に問題を解いてくれるはずだ」という期待。

残念ながらこれは正しくない。むしろ、多くの失敗はここから生まれている。

AIがうまく働く領域と、働きづらい領域には、構造的に明確な境界線がある。

その境界の名前が創発性だ。

創発タスクとは何か？

創発タスクとは、 「答えが事前に決まっていない問題」のことだ。

新しいサービスアイデアを考える
まだ整理されていない市場を評価する
曖昧な要件から構造を設計する
前例のない障害原因を推測する
新しい研究仮説を生成する

ここでは、 "やるべきこと" そのものが問題を解きながら変化していく。

つまり、判断の文脈が固定できない。

LLMはこれが得意だ。巨大モデルに蓄積されたパターンから、多様なアイデアや視点を引き出すことができる。

ただし—— 得意なのは「発想」や「観察」、つまり生成的な部分だけだ。

非創発タスクとは何か？

一方、非創発タスクとは、

「やるべきことが事前に決まっており、手順も安定している」 領域だ。

データ集計
相関分析
異常検知
API呼び出し
スクリプト生成
書類の下書き
チェックリスト評価

ここには「驚き」はいらない。求められるのは正確さ、安定性、一貫性だ。

AI設計で重要なのは「創発に任せる部分を最小化する」こと

AIに任せてよい創発は "判断の補助" のみ。実行は外に出し、安定させるべき。

ところがよくある失敗はこうだ：

❌ 創発 × 自律 × タスク実行

→ AIがタスクを自分で決め、自分で実行し、自分で評価する → ループ・暴走・無意味な探索・コスト爆発

これは現在の技術で最も破綻しやすい構造だ。

象徴的なのが Devin問題 である。

Devinが示した限界 ― 「創発 × 自律」はまだ難しい

Devinは「AIソフトウェアエンジニア」を自称した最初の大規模プロジェクトだった。驚くべき能力を示す一方で、次のような問題も頻発した。

無限ループ
不必要な探索
自分で壊したコードを直し続ける
"正しそうに見える"が実際は動かない修正
パフォーマンスの悪い手順を延々と試す

これは設計パターンが悪いのではなく、 創発性を完全自律で回すこと自体が、構造的に難しい ことを示している。

理由は明確だ。

創発タスクには「ルール不定」「探索の無限性」が内在するから。人間のソフトウェアエンジニアでさえ、経験・規律・制約・メンタルモデルで探索空間を絞っている。 AIにはそれがない。

現時点で唯一安定するのは「創発 × 伴走」の構造

創発は、AIの強みである。新しい視点やバリエーションを生成できる。

ただし、それを 制御するのは人間の役割 だ。

「方向がズレている」
「これは意味が薄い」
「この方針は採用しない」

こうした調整点を、人間が1ミリでも挟むと、 創発の暴走は瞬間的に止まる。

この構造を私は 伴走型 と呼んでいる。

3つの構造

創発 × 伴走 → 実装可能
創発 × 自律 → 破綻しやすい
非創発 × 自律 → 実務で最も強い

この3区分は、AIエージェント設計の根幹になる。

「創発が必要か？」は設計前に必ず判定するべき

タスクを見たら、最初にやるべきことはこれだ。

創発が必要？
それは自律で回せる？
回せないなら伴走にする？
伴走ならタスク範囲を固定して文脈を守る？

多くの現場で起きている混乱は、 この判定をしていないことに起因している。

非創発タスクは「リスト化」と「事前計算」が最適解

非創発タスクのほとんどは、実は「既知の分析・操作のパターン」に過ぎない。

それは次章で扱う レポート化アーキテクチャ につながっていく。

データ分析は創発ではない
パターンカタログを網羅的に適用すれば終わる
だからリアルタイムAIは必要ない
バッチで計算し、レポートとして永続化すればよい

創発タスクと非創発タスクを分けて考えると、この構造が非常にクリアになる。

（追記）伴走型と自律型 ― 創発と安定性を決めるもうひとつの軸

創発タスクかどうかを判定した後、もうひとつ考えるべき軸がある。

それが 伴走型（Co-pilot） と 自律型（Autonomous） の構造だ。

これは技術の話ではなく、 「誰が判断の主語になるか」という設計思想の話だ。

伴走型（Co-pilot）とは何か

伴走型のエージェントは、

AIはアイデアを出す
人間が方向性を決める
判断は人間の側にある
AIは"補助エンジン"として動く

という構造をとる。

創発タスクは本質的に曖昧だ。方向性が揺れ、探索空間が広がり続ける。

この不安定さを収束させてくれるのが「人間の一声」である。

1回人間がチェックするだけで、創発の暴走は止まる。 これが伴走型の強さだ。

自律型（Autonomous）とは何か

一方、自律型は

AI自身がタスクを決め
AI自身が実行し
AI自身が評価する

という"完全自走モード"である。

非創発タスク（定型処理）では非常に強い。

しかし創発タスクを自律型で扱うと—— 探索空間が無制限に広がり、ループや暴走が発生しやすい。

Devinが示した限界は、この構造的な性質に起因する。

伴走型と自律型の違い

伴走型（Co-pilot）

AIは「アイデアや視点」を出し、人間が方向性を決める構造。

創発との相性: ◎（人間が収束させる）
判断の主語: 人間
タスク決定: 人間
探索空間: 制限される
安定性: 高い
必要な構造: 文脈の純度・チェックポイント
典型の失敗: ほぼ発生しない
最適領域: 創発タスク（曖昧な問題・新規課題）

創発タスクは、たった一度の人間の介入で方向性が収束する。その安定性の高さが、伴走型の強みだ。

自律型（Autonomous）

AIが自分で方針を決め、実行し、評価する完全自走型。

創発との相性: ×（暴走しやすい）
判断の主語: AI
タスク決定: AI
探索空間: 無限に広がる
安定性: 低い（ループしやすい）
必要な構造: 強制ルール・制約
典型の失敗: Devin問題・過剰探索
最適領域: 非創発タスク（定型処理・手順明確）

非創発タスクなら、自律型は極めて強い。

3行でまとめると、こうなる

創発 × 伴走 → 実務で最も強い
非創発 × 自律 → 安定性が高い
創発 × 自律 → 現時点では破綻しやすい

この3つは、エージェント設計の設計思想を決める"軸"になる。

次章への橋渡し：非創発 × 自律の最適解が「レポート化」になる

非創発タスクの大半はすでにパターン化されている。創発を必要としない。つまり自律型で安定運用できる。

そして非創発 × 自律の最適解が、次章で扱う 「レポート化アーキテクチャ」 である。

この章のまとめ

AIに向いているのは「創発＝判断の補助」であって「自律的な問題解決」ではない
創発 × 自律は現時点の技術では破綻しやすい
Devin問題が示したのは、創発の無限性をAI単体では制御できないこと
非創発タスクは手順が固定しており、外部化・テンプレート化・事前計算が最適
設計前に：創発か？自律か？人間は入るか？を必ず判定する

次章（第6章）は、 データ分析の本丸：レポート化アーキテクチャ に進む。

ここでシリーズ全体の"実務的インパクト"が最大化される。

Last Updated: 2025-12-04

第5章：創発タスクと非創発タスクの境界線 ​

― Devinでさえ破綻する領域と、最初からAIに任せるべきでない領域 ​

創発タスクとは何か？ ​

非創発タスクとは何か？ ​

AI設計で重要なのは「創発に任せる部分を最小化する」こと ​

❌ 創発 × 自律 × タスク実行 ​

Devinが示した限界 ― 「創発 × 自律」はまだ難しい ​

理由は明確だ。 ​

現時点で唯一安定するのは「創発 × 伴走」の構造 ​

3つの構造 ​

「創発が必要か？」は設計前に必ず判定するべき ​

非創発タスクは「リスト化」と「事前計算」が最適解 ​

（追記）伴走型と自律型 ― 創発と安定性を決めるもうひとつの軸 ​

伴走型（Co-pilot）とは何か ​

自律型（Autonomous）とは何か ​

伴走型と自律型の違い ​

伴走型（Co-pilot） ​

自律型（Autonomous） ​

3行でまとめると、こうなる ​

次章への橋渡し：非創発 × 自律の最適解が「レポート化」になる ​

この章のまとめ ​