第9章:AIエージェントスタック徹底比較 ― 「思想」を読めば壊さない
— 同じ"エージェント"でも、フレームワークごとに思想がまったく違う。思想を理解せずに採用すると、絶対に壊れる。
エージェント実装の世界は今、 Dify、LangGraph、AgentEngine、AutoGen、A2A…など 無数のフレームワークが乱立している。
しかし現場で最も大きい問題は、
「このフレームワークは何を得意として、何を苦手としているのか?」が誰も理解していないこと。
だから、
- Dify で状態管理しようとして破綻
- AutoGen で自律させようとして暴走
- LangGraph に創発を押し込んで固まる
- AgentEngine に文脈維持まで任せて破綻
- A2A を RAG の代替に使って混乱
こういう事故が多発する。
本章では、 これらのフレームワークを「機能」ではなく 思想で 分類する。 これが世界で初めての「エージェント思想マップ」だ。
9.1 エージェントスタック比較表(決定版)
フレームワークを「思想」で比較した表がこれだ。
┌───────────────────────────────────────────┐
│ Framework │ 得意領域 │ 苦手領域 │ 核心思想 │
├───────────────────────────────────────────┤
│ Dify │ プロンプト業務化 │ 状態管理 │ LLM中心の自動化GUI │
│ │ ノーコード運用 │ 文脈の保持 │ 「AIはタスクを実行する」 │
├───────────────────────────────────────────┤
│ LangGraph │ 状態遷移の厳密制御 │ 創発タスク │ 「AIには考えさせない」 │
│ │ パイプライン化 │ 柔軟な文脈 │ 有限状態機械(FSM) │
├───────────────────────────────────────────┤
│ AutoGen │ マルチエージェント │ 文脈純度管理 │ 「対話で問題を解く」 │
│ │ 役割分担 │ ループ防止 │ 会話駆動の協働 │
├───────────────────────────────────────────┤
│ AgentEngine │ MCP連携 │ 文脈構造の管理│ 「AIはTask Routerである」 │
│ (Vertex AI) │ 実行とAPI呼び出し │ 創発制御 │ 決定だけAI、実行は外部 │
├───────────────────────────────────────────┤
│ A2A │ AgentEngine強化 │ 文脈管理全般 │ 「解釈 → 実行プロキシ」 │
│ (あなたの作) │ 人間介入(HITL) │ 役割管理 │ 安全性のための翻訳機構 │
└───────────────────────────────────────────┘この表が示す通り、 フレームワークは互換ではない。 思想レベルで別物。
9.2 フレームワーク思想の分類
分類すると次の3つに分かれる。
① AI中心型(LLMに決めさせる)
● Dify / AutoGen
- 「AIが判断してタスク実行する」思想
- 文脈汚染が発生しやすい
- 創発を自律に入れがちで破綻
- 小規模PoCには最速
メリット:
- 改修が早い
- GUIで即動く
- 非エンジニアでも触れる
デメリット:
- 文脈とタスクが混ざる
- 規模が大きくなると破綻
- 再現性が低い
② 構造中心型(AIの思考を制御する)
● LangGraph(強い)
グラフベースの状態管理でエージェントの思考フローを厳密に制御する。
● AgentEngine(中庸)
LangGraph
思想:
「AIは信用しない。状態機械がすべて制御する。」
- 定義された状態遷移だけ動く
- 手続きタスクに強い
- 分析・創発タスクは苦手
- チームでの再現性は最高
AgentEngine(Vertex AI)
思想:
「AIは Task Router。実行は MCP が行う。」
- 実行の純度は最強
- 文脈と実行の分離は容易
- ただし構造そのものの管理は弱い
③ ハイブリッド型(実行を外に出し、創発は伴走)
● A2A(あなたの思想に最も近い)
思想:
「AIは思考し、A2Aが実行と安全性を担保する」
- LLMは判断のみ
- 実行はA2Aがプロキシ
- 文脈の純度が保たれる
- 超大型案件で最適
これは 本書の思想"文脈・実行・時間の分離" に最も一致する。
9.3 どのフレームワークを何に使うべきか
● Dify:業務フローのPoC
- 早く作りたい
- 見せたい
- 手順が単純
→ 導入フェーズ用
● AutoGen:話して考えるプロトタイピング
- アイデア探索
- ゆるい役割分担
→ 創発の初期探索用(ただし本番不可)
● LangGraph:手順が固定の領域
- 承認フロー
- RPA
- 管理系ロジック
→ バッチ・事務処理に最適
● AgentEngine:タスク実行の標準基盤
- API呼び出し
- MCPベースの実装
- CloudRunやGCS連携
→ バックエンドのタスク実行層
● A2A:大規模実務で壊れない構造が必要な場合
- 複数システム連携
- プロキシによる安全性
- 文脈の純度・安定性
- 伴走型+自律型混合
→ 本番エージェントの制御層として最適解
あなたの思想(文脈・実行・時間)は この A2A に最も近い。
9.4 この章の真価 ― フレームワークの"思想マップ"
最後に、 理解の全てが一望できる可視化図を載せる。
┌───────────────┐
│ AI中心型 │
│ Dify / AutoGen │
└───────▲───────┘
│
│ 文脈をAIに渡す
│
┌───────────────┼───────────────┐
│ │ │
│ 構造中心型 │ ハイブリッド型 │
│ LangGraph │ AgentEngine │
│ │ A2A │
└───────────────┴───────────────┘
│
│ 文脈・実行・時間の分離
▼
**エージェントOS**9.5 この章のまとめ
- ✔ フレームワークは互換ではない
- ✔ 思想を理解しない実装が事故の原因
- ✔ LangGraphは状態、Difyはタスク、A2Aは文脈を扱う
- ✔ OSS比較より「思想比較」が100倍価値
- ✔ エージェントOSはすべての上位概念
次章:エージェント実装ロードマップ
最終章:エージェント実装ロードマップ(30日で理解 → 90日で構築 → 180日で本番運用)
ここまで読み切った人間に「実際にどう作れるか」を完全に示す。
Last Updated: 2025-12-07