Skip to content

第5章:創発タスクと非創発タスクの境界線

― Devinでさえ破綻する領域と、最初からAIに任せるべきでない領域

AIエージェントの設計で、最も誤解が多い部分がある。

「AIに任せれば自律的に問題を解いてくれるはずだ」 という期待。

残念ながらこれは正しくない。 むしろ、多くの失敗はここから生まれている。

AIがうまく働く領域と、働きづらい領域には、 構造的に明確な境界線がある。

その境界の名前が 創発性 だ。


創発タスクとは何か?

創発タスクとは、 「答えが事前に決まっていない問題」のことだ。

  • 新しいサービスアイデアを考える
  • まだ整理されていない市場を評価する
  • 曖昧な要件から構造を設計する
  • 前例のない障害原因を推測する
  • 新しい研究仮説を生成する

ここでは、 "やるべきこと" そのものが問題を解きながら変化していく。

つまり、判断の文脈が固定できない。

LLMはこれが得意だ。 巨大モデルに蓄積されたパターンから、 多様なアイデアや視点を引き出すことができる。

ただし—— 得意なのは「発想」や「観察」、つまり 生成的な部分だけ だ。


非創発タスクとは何か?

一方、非創発タスクとは、

「やるべきことが事前に決まっており、手順も安定している」 領域だ。

  • データ集計
  • 相関分析
  • 異常検知
  • API呼び出し
  • スクリプト生成
  • 書類の下書き
  • チェックリスト評価

ここには「驚き」はいらない。 求められるのは正確さ、安定性、一貫性だ。


AI設計で重要なのは「創発に任せる部分を最小化する」こと

AIに任せてよい創発は "判断の補助" のみ。 実行は外に出し、安定させるべき。

ところがよくある失敗はこうだ:

❌ 創発 × 自律 × タスク実行

→ AIがタスクを自分で決め、自分で実行し、自分で評価する → ループ・暴走・無意味な探索・コスト爆発

これは現在の技術で最も破綻しやすい構造だ。

象徴的なのが Devin問題 である。


Devinが示した限界 ― 「創発 × 自律」はまだ難しい

Devinは「AIソフトウェアエンジニア」を自称した最初の大規模プロジェクトだった。 驚くべき能力を示す一方で、次のような問題も頻発した。

  • 無限ループ
  • 不必要な探索
  • 自分で壊したコードを直し続ける
  • "正しそうに見える"が実際は動かない修正
  • パフォーマンスの悪い手順を延々と試す

これは設計パターンが悪いのではなく、 創発性を完全自律で回すこと自体が、構造的に難しい ことを示している。

理由は明確だ。

創発タスクには「ルール不定」「探索の無限性」が内在するから。 人間のソフトウェアエンジニアでさえ、 経験・規律・制約・メンタルモデルで探索空間を絞っている。 AIにはそれがない。


現時点で唯一安定するのは「創発 × 伴走」の構造

創発は、AIの強みである。 新しい視点やバリエーションを生成できる。

ただし、それを 制御するのは人間の役割 だ。

  • 「方向がズレている」
  • 「これは意味が薄い」
  • 「この方針は採用しない」

こうした調整点を、人間が1ミリでも挟むと、 創発の暴走は瞬間的に止まる。

この構造を私は 伴走型 と呼んでいる。

3つの構造

  • 創発 × 伴走 → 実装可能
  • 創発 × 自律 → 破綻しやすい
  • 非創発 × 自律 → 実務で最も強い

この3区分は、AIエージェント設計の根幹になる。


「創発が必要か?」は設計前に必ず判定するべき

タスクを見たら、最初にやるべきことはこれだ。

  1. 創発が必要?
  2. それは自律で回せる?
  3. 回せないなら伴走にする?
  4. 伴走ならタスク範囲を固定して文脈を守る?

多くの現場で起きている混乱は、 この判定をしていないことに起因している。


非創発タスクは「リスト化」と「事前計算」が最適解

非創発タスクのほとんどは、 実は「既知の分析・操作のパターン」に過ぎない。

それは次章で扱う レポート化アーキテクチャ につながっていく。

  • データ分析は創発ではない
  • パターンカタログを網羅的に適用すれば終わる
  • だからリアルタイムAIは必要ない
  • バッチで計算し、レポートとして永続化すればよい

創発タスクと非創発タスクを分けて考えると、 この構造が非常にクリアになる。


(追記)伴走型と自律型 ― 創発と安定性を決めるもうひとつの軸

創発タスクかどうかを判定した後、 もうひとつ考えるべき軸がある。

それが 伴走型(Co-pilot)自律型(Autonomous) の構造だ。

これは技術の話ではなく、 「誰が判断の主語になるか」という設計思想の話だ。


伴走型(Co-pilot)とは何か

伴走型のエージェントは、

  • AIはアイデアを出す
  • 人間が方向性を決める
  • 判断は人間の側にある
  • AIは"補助エンジン"として動く

という構造をとる。

創発タスクは本質的に曖昧だ。 方向性が揺れ、探索空間が広がり続ける。

この不安定さを収束させてくれるのが「人間の一声」である。

1回人間がチェックするだけで、創発の暴走は止まる。 これが伴走型の強さだ。


自律型(Autonomous)とは何か

一方、自律型は

  • AI自身がタスクを決め
  • AI自身が実行し
  • AI自身が評価する

という"完全自走モード"である。

非創発タスク(定型処理)では非常に強い。

しかし創発タスクを自律型で扱うと—— 探索空間が無制限に広がり、ループや暴走が発生しやすい。

Devinが示した限界は、この構造的な性質に起因する。


伴走型と自律型の違い

伴走型(Co-pilot)

AIは「アイデアや視点」を出し、人間が方向性を決める構造。

  • 創発との相性: ◎(人間が収束させる)
  • 判断の主語: 人間
  • タスク決定: 人間
  • 探索空間: 制限される
  • 安定性: 高い
  • 必要な構造: 文脈の純度・チェックポイント
  • 典型の失敗: ほぼ発生しない
  • 最適領域: 創発タスク(曖昧な問題・新規課題)

創発タスクは、たった一度の人間の介入で方向性が収束する。 その安定性の高さが、伴走型の強みだ。

自律型(Autonomous)

AIが自分で方針を決め、実行し、評価する完全自走型。

  • 創発との相性: ×(暴走しやすい)
  • 判断の主語: AI
  • タスク決定: AI
  • 探索空間: 無限に広がる
  • 安定性: 低い(ループしやすい)
  • 必要な構造: 強制ルール・制約
  • 典型の失敗: Devin問題・過剰探索
  • 最適領域: 非創発タスク(定型処理・手順明確)

非創発タスクなら、 自律型は極めて強い。


3行でまとめると、こうなる

  • 創発 × 伴走 → 実務で最も強い
  • 非創発 × 自律 → 安定性が高い
  • 創発 × 自律 → 現時点では破綻しやすい

この3つは、エージェント設計の設計思想を決める"軸"になる。


次章への橋渡し:非創発 × 自律の最適解が「レポート化」になる

非創発タスクの大半はすでにパターン化されている。 創発を必要としない。 つまり自律型で安定運用できる。

そして非創発 × 自律の最適解が、 次章で扱う 「レポート化アーキテクチャ」 である。


この章のまとめ

  • AIに向いているのは「創発=判断の補助」であって「自律的な問題解決」ではない
  • 創発 × 自律は現時点の技術では破綻しやすい
  • Devin問題が示したのは、創発の無限性をAI単体では制御できないこと
  • 非創発タスクは手順が固定しており、外部化・テンプレート化・事前計算が最適
  • 設計前に:創発か?自律か?人間は入るか?を必ず判定する

次章(第6章)は、 データ分析の本丸:レポート化アーキテクチャ に進む。

ここでシリーズ全体の"実務的インパクト"が最大化される。


Last Updated: 2025-12-04

Code: MIT / Content: CC BY-SA 4.0