第9章：AIエージェントスタック徹底比較 ― 「思想」を読めば壊さない

— 同じ"エージェント"でも、フレームワークごとに思想がまったく違う。思想を理解せずに採用すると、絶対に壊れる。

エージェント実装の世界は今、 Dify、LangGraph、AgentEngine、AutoGen、A2A…など無数のフレームワークが乱立している。

しかし現場で最も大きい問題は、

「このフレームワークは何を得意として、何を苦手としているのか？」が誰も理解していないこと。

だから、

Dify で状態管理しようとして破綻
AutoGen で自律させようとして暴走
LangGraph に創発を押し込んで固まる
AgentEngine に文脈維持まで任せて破綻
A2A を RAG の代替に使って混乱

こういう事故が多発する。

本章では、これらのフレームワークを「機能」ではなく 思想で 分類する。これが世界で初めての「エージェント思想マップ」だ。

9.1 エージェントスタック比較表（決定版）

フレームワークを「思想」で比較した表がこれだ。

┌───────────────────────────────────────────┐
│     Framework     │     得意領域     │   苦手領域   │   核心思想            │
├───────────────────────────────────────────┤
│ Dify              │ プロンプト業務化   │ 状態管理     │ LLM中心の自動化GUI       │
│                   │ ノーコード運用    │ 文脈の保持   │ 「AIはタスクを実行する」  │
├───────────────────────────────────────────┤
│ LangGraph         │ 状態遷移の厳密制御 │ 創発タスク   │ 「AIには考えさせない」     │
│                   │ パイプライン化    │ 柔軟な文脈   │ 有限状態機械（FSM）        │
├───────────────────────────────────────────┤
│ AutoGen           │ マルチエージェント │ 文脈純度管理 │ 「対話で問題を解く」       │
│                   │ 役割分担          │ ループ防止   │ 会話駆動の協働              │
├───────────────────────────────────────────┤
│ AgentEngine       │ MCP連携           │ 文脈構造の管理│ 「AIはTask Routerである」   │
│ (Vertex AI)       │ 実行とAPI呼び出し │ 創発制御     │ 決定だけAI、実行は外部      │
├───────────────────────────────────────────┤
│ A2A               │ AgentEngine強化    │ 文脈管理全般 │ 「解釈 → 実行プロキシ」      │
│ (あなたの作)      │ 人間介入（HITL）    │ 役割管理     │ 安全性のための翻訳機構       │
└───────────────────────────────────────────┘

この表が示す通り、 フレームワークは互換ではない。思想レベルで別物。

9.2 フレームワーク思想の分類

分類すると次の3つに分かれる。

① AI中心型（LLMに決めさせる）

● Dify / AutoGen

「AIが判断してタスク実行する」思想
文脈汚染が発生しやすい
創発を自律に入れがちで破綻
小規模PoCには最速

メリット：

改修が早い
GUIで即動く
非エンジニアでも触れる

デメリット：

文脈とタスクが混ざる
規模が大きくなると破綻
再現性が低い

② 構造中心型（AIの思考を制御する）

● LangGraph（強い）

グラフベースの状態管理でエージェントの思考フローを厳密に制御する。

● AgentEngine（中庸）

LangGraph

思想：

「AIは信用しない。状態機械がすべて制御する。」

定義された状態遷移だけ動く
手続きタスクに強い
分析・創発タスクは苦手
チームでの再現性は最高

AgentEngine（Vertex AI）

思想：

「AIは Task Router。実行は MCP が行う。」

実行の純度は最強
文脈と実行の分離は容易
ただし構造そのものの管理は弱い

③ ハイブリッド型（実行を外に出し、創発は伴走）

● A2A（あなたの思想に最も近い）

思想：

「AIは思考し、A2Aが実行と安全性を担保する」

LLMは判断のみ
実行はA2Aがプロキシ
文脈の純度が保たれる
超大型案件で最適

これは 本書の思想"文脈・実行・時間の分離" に最も一致する。

9.3 どのフレームワークを何に使うべきか

● Dify：業務フローのPoC

早く作りたい
見せたい
手順が単純

→ 導入フェーズ用

● AutoGen：話して考えるプロトタイピング

アイデア探索
ゆるい役割分担

→ 創発の初期探索用（ただし本番不可）

● LangGraph：手順が固定の領域

承認フロー
RPA
管理系ロジック

→ バッチ・事務処理に最適

● AgentEngine：タスク実行の標準基盤

API呼び出し
MCPベースの実装
CloudRunやGCS連携

→ バックエンドのタスク実行層

● A2A：大規模実務で壊れない構造が必要な場合

複数システム連携
プロキシによる安全性
文脈の純度・安定性
伴走型＋自律型混合

→ 本番エージェントの制御層として最適解

あなたの思想（文脈・実行・時間）はこの A2A に最も近い。

9.4 この章の真価 ― フレームワークの"思想マップ"

最後に、理解の全てが一望できる可視化図を載せる。

                ┌───────────────┐
                │ AI中心型        │
                │ Dify / AutoGen │
                └───────▲───────┘
                        │
                        │ 文脈をAIに渡す
                        │
        ┌───────────────┼───────────────┐
        │               │               │
        │ 構造中心型     │ ハイブリッド型   │
        │ LangGraph     │ AgentEngine   │
        │               │ A2A           │
        └───────────────┴───────────────┘
                        │
                        │ 文脈・実行・時間の分離
                        ▼
                **エージェントOS**

9.5 この章のまとめ

✔ フレームワークは互換ではない
✔ 思想を理解しない実装が事故の原因
✔ LangGraphは状態、Difyはタスク、A2Aは文脈を扱う
✔ OSS比較より「思想比較」が100倍価値
✔ エージェントOSはすべての上位概念

次章：エージェント実装ロードマップ

最終章：エージェント実装ロードマップ（30日で理解 → 90日で構築 → 180日で本番運用）

ここまで読み切った人間に「実際にどう作れるか」を完全に示す。

Last Updated: 2025-12-07

第9章：AIエージェントスタック徹底比較 ― 「思想」を読めば壊さない ​

— 同じ"エージェント"でも、フレームワークごとに思想がまったく違う。思想を理解せずに採用すると、絶対に壊れる。 ​

9.1 エージェントスタック比較表（決定版） ​

9.2 フレームワーク思想の分類 ​

① AI中心型（LLMに決めさせる） ​

● Dify / AutoGen ​

② 構造中心型（AIの思考を制御する） ​

● LangGraph（強い） ​

● AgentEngine（中庸） ​

LangGraph ​

AgentEngine（Vertex AI） ​

③ ハイブリッド型（実行を外に出し、創発は伴走） ​

● A2A（あなたの思想に最も近い） ​

9.3 どのフレームワークを何に使うべきか ​

● Dify：業務フローのPoC ​

● AutoGen：話して考えるプロトタイピング ​

● LangGraph：手順が固定の領域 ​

● AgentEngine：タスク実行の標準基盤 ​

● A2A：大規模実務で壊れない構造が必要な場合 ​

9.4 この章の真価 ― フレームワークの"思想マップ" ​

9.5 この章のまとめ ​

次章：エージェント実装ロードマップ ​