Skip to content

第9章:AIエージェントスタック徹底比較 ― 「思想」を読めば壊さない

— 同じ"エージェント"でも、フレームワークごとに思想がまったく違う。思想を理解せずに採用すると、絶対に壊れる。


エージェント実装の世界は今、 Dify、LangGraph、AgentEngine、AutoGen、A2A…など 無数のフレームワークが乱立している。

しかし現場で最も大きい問題は、

「このフレームワークは何を得意として、何を苦手としているのか?」が誰も理解していないこと。

だから、

  • Dify で状態管理しようとして破綻
  • AutoGen で自律させようとして暴走
  • LangGraph に創発を押し込んで固まる
  • AgentEngine に文脈維持まで任せて破綻
  • A2A を RAG の代替に使って混乱

こういう事故が多発する。

本章では、 これらのフレームワークを「機能」ではなく 思想で 分類する。 これが世界で初めての「エージェント思想マップ」だ。


9.1 エージェントスタック比較表(決定版)

フレームワークを「思想」で比較した表がこれだ。

┌───────────────────────────────────────────┐
│     Framework     │     得意領域     │   苦手領域   │   核心思想            │
├───────────────────────────────────────────┤
│ Dify              │ プロンプト業務化   │ 状態管理     │ LLM中心の自動化GUI       │
│                   │ ノーコード運用    │ 文脈の保持   │ 「AIはタスクを実行する」  │
├───────────────────────────────────────────┤
│ LangGraph         │ 状態遷移の厳密制御 │ 創発タスク   │ 「AIには考えさせない」     │
│                   │ パイプライン化    │ 柔軟な文脈   │ 有限状態機械(FSM)        │
├───────────────────────────────────────────┤
│ AutoGen           │ マルチエージェント │ 文脈純度管理 │ 「対話で問題を解く」       │
│                   │ 役割分担          │ ループ防止   │ 会話駆動の協働              │
├───────────────────────────────────────────┤
│ AgentEngine       │ MCP連携           │ 文脈構造の管理│ 「AIはTask Routerである」   │
│ (Vertex AI)       │ 実行とAPI呼び出し │ 創発制御     │ 決定だけAI、実行は外部      │
├───────────────────────────────────────────┤
│ A2A               │ AgentEngine強化    │ 文脈管理全般 │ 「解釈 → 実行プロキシ」      │
│ (あなたの作)      │ 人間介入(HITL)    │ 役割管理     │ 安全性のための翻訳機構       │
└───────────────────────────────────────────┘

この表が示す通り、 フレームワークは互換ではない。 思想レベルで別物。


9.2 フレームワーク思想の分類

分類すると次の3つに分かれる。


① AI中心型(LLMに決めさせる)

● Dify / AutoGen

  • 「AIが判断してタスク実行する」思想
  • 文脈汚染が発生しやすい
  • 創発を自律に入れがちで破綻
  • 小規模PoCには最速

メリット:

  • 改修が早い
  • GUIで即動く
  • 非エンジニアでも触れる

デメリット:

  • 文脈とタスクが混ざる
  • 規模が大きくなると破綻
  • 再現性が低い

② 構造中心型(AIの思考を制御する)

● LangGraph(強い)

グラフベースの状態管理でエージェントの思考フローを厳密に制御する。

● AgentEngine(中庸)


LangGraph

思想:

「AIは信用しない。状態機械がすべて制御する。」

  • 定義された状態遷移だけ動く
  • 手続きタスクに強い
  • 分析・創発タスクは苦手
  • チームでの再現性は最高

AgentEngine(Vertex AI)

思想:

「AIは Task Router。実行は MCP が行う。」

  • 実行の純度は最強
  • 文脈と実行の分離は容易
  • ただし構造そのものの管理は弱い

③ ハイブリッド型(実行を外に出し、創発は伴走)

● A2A(あなたの思想に最も近い)

思想:

「AIは思考し、A2Aが実行と安全性を担保する」

  • LLMは判断のみ
  • 実行はA2Aがプロキシ
  • 文脈の純度が保たれる
  • 超大型案件で最適

これは 本書の思想"文脈・実行・時間の分離" に最も一致する。


9.3 どのフレームワークを何に使うべきか

● Dify:業務フローのPoC

  • 早く作りたい
  • 見せたい
  • 手順が単純

導入フェーズ用


● AutoGen:話して考えるプロトタイピング

  • アイデア探索
  • ゆるい役割分担

創発の初期探索用(ただし本番不可)


● LangGraph:手順が固定の領域

  • 承認フロー
  • RPA
  • 管理系ロジック

バッチ・事務処理に最適


● AgentEngine:タスク実行の標準基盤

  • API呼び出し
  • MCPベースの実装
  • CloudRunやGCS連携

バックエンドのタスク実行層


● A2A:大規模実務で壊れない構造が必要な場合

  • 複数システム連携
  • プロキシによる安全性
  • 文脈の純度・安定性
  • 伴走型+自律型混合

本番エージェントの制御層として最適解

あなたの思想(文脈・実行・時間)は この A2A に最も近い。


9.4 この章の真価 ― フレームワークの"思想マップ"

最後に、 理解の全てが一望できる可視化図を載せる。

                ┌───────────────┐
                │ AI中心型        │
                │ Dify / AutoGen │
                └───────▲───────┘

                        │ 文脈をAIに渡す

        ┌───────────────┼───────────────┐
        │               │               │
        │ 構造中心型     │ ハイブリッド型   │
        │ LangGraph     │ AgentEngine   │
        │               │ A2A           │
        └───────────────┴───────────────┘

                        │ 文脈・実行・時間の分離

                **エージェントOS**

9.5 この章のまとめ

  • フレームワークは互換ではない
  • 思想を理解しない実装が事故の原因
  • LangGraphは状態、Difyはタスク、A2Aは文脈を扱う
  • OSS比較より「思想比較」が100倍価値
  • エージェントOSはすべての上位概念

次章:エージェント実装ロードマップ

最終章:エージェント実装ロードマップ(30日で理解 → 90日で構築 → 180日で本番運用)

ここまで読み切った人間に「実際にどう作れるか」を完全に示す。


Last Updated: 2025-12-07

Code: MIT / Content: CC BY-SA 4.0