
2024 年被称为 Agent 框架的"寒武纪大爆发"——GitHub 上超过 1000 Stars 的 Agent 相关仓库从 14 个猛增至 89 个,增长 535%。进入 2026 年,格局已显著收敛:优胜劣汰之后,存活者各自占据了清晰的生态位。MCP(Model Context Protocol)标准化、A2A(Agent-to-Agent)协议的兴起、Context Engineering 理念的普及,正在重塑框架竞争的底层逻辑。

本报告对 10 个主流 Agent 开发框架进行系统性技术调研,从架构设计、核心功能、生态成熟度、生产部署能力等维度展开深度分析,旨在帮助工程师和技术决策者在实际项目中做出精准的框架选型。
这 10 个框架覆盖了 Agent 开发的全部范式:LangGraph 以图状态机为核心提供底层控制力;CrewAI 用角色驱动的高层抽象加速多 Agent 协作落地;LlamaIndex 在数据连接和 RAG 领域建立了深厚护城河;PydanticAI 将 Python 类型安全理念引入 Agent 开发;Agno 提供从框架到运行时的全栈方案;Microsoft Agent Framework 统一了 AutoGen 与 Semantic Kernel 的企业级能力;OpenAI Agents SDK 以极简抽象降低入门门槛;Google ADK 为 Gemini 生态构建了代码优先的开发体验;Dify 以可视化低代码平台赋能非技术团队;AgentScope 从阿里巴巴通义实验室出发,强调透明可控与国内生态适配。

框架 | 定位 | 最适合场景 | 推荐指数 |
|---|---|---|---|
LangGraph | 底层图状态机编排引擎 | 复杂有状态工作流、需要精细控制的生产系统 | ⭐⭐⭐⭐⭐ |
CrewAI | 角色驱动的多 Agent 协作框架 | 内容生产、研究分析、快速原型 | ⭐⭐⭐⭐ |
LlamaIndex | 数据密集型 Agent 与 RAG 框架 | 企业知识库、文档问答、数据检索 Agent | ⭐⭐⭐⭐⭐ |
PydanticAI | 类型安全的轻量 Agent 框架 | 需要强类型保障的生产 Agent、API 集成 | ⭐⭐⭐⭐ |
Agno | 全栈 Agent 运行时平台 | 需要快速从原型到生产、全栈 Agent 系统 | ⭐⭐⭐⭐ |
Microsoft Agent Framework | 企业级统一 Agent SDK | Azure 生态企业部署、.NET/Python 双栈团队 | ⭐⭐⭐⭐ |
OpenAI Agents SDK | 极简 Agent 开发工具包 | OpenAI 模型快速开发、语音 Agent、轻量多 Agent | ⭐⭐⭐⭐ |
Google ADK | Google 生态 Agent 开发套件 | Gemini 生态开发、Google Cloud 部署、多语言团队 | ⭐⭐⭐½ |
Dify | 可视化低代码 Agent 平台 | 非技术团队、快速 POC、私有化部署 | ⭐⭐⭐⭐ |
AgentScope | 透明可控的多 Agent 框架 | 国内企业私有化、阿里云生态、学术研究 | ⭐⭐⭐½ |
Agent 开发框架是为构建基于大语言模型(LLM)的自主代理系统而设计的软件工具包。与传统的 LLM 应用(如聊天机器人)不同,Agent 具备感知环境、自主决策、使用工具、多步推理的能力。一个 Agent 框架通常包含以下核心组件:


MCP(Model Context Protocol)标准化:由 Anthropic 在 2024 年底提出,MCP 定义了 LLM 与外部工具/数据源交互的标准协议。到 2026 年 3 月,几乎所有主流框架都已支持 MCP,它正在成为 Agent 工具调用的事实标准,取代了此前各框架自定义的工具接口。

A2A(Agent-to-Agent)协议:由 Google 在 2025 年提出,A2A 定义了不同框架构建的 Agent 之间的通信标准。Microsoft Agent Framework、Google ADK、AgentScope 已原生支持 A2A,这标志着 Agent 生态从"框架孤岛"走向"互操作网络"。

Context Engineering:2025 年兴起的理念,强调精心管理传入 LLM 上下文窗口的信息质量和结构,而非仅依赖 prompt engineering。这推动了框架在记忆压缩、上下文过滤、动态工具选择等方面的创新。

Human-in-the-Loop(HITL)成熟化:从早期的"确认/拒绝"二选一,进化为支持中断/恢复、状态检查点、分级审批等精细化人机协同模式。LangGraph 和 Microsoft Agent Framework 在此方面领先。

框架融合趋势:2025 年 10 月 Microsoft 宣布合并 AutoGen 与 Semantic Kernel,2026 年 2 月达到 Release Candidate 状态,标志着行业从"百花齐放"走向"整合收敛"。
本报告从以下 7 个维度评估各框架:


字段 | 内容 |
|---|---|
开发方 | LangChain Inc. |
开源协议 | MIT |
主要语言 | Python, TypeScript |
GitHub Stars(约) | 24,600(Python)+ 2,400(JS) |
首发时间 | 2024 年初 |
最新版本 | v1.1.x(2026 年 3 月) |
官方定位 | 低层级 Agent 编排框架,专为生产环境构建 |

LangGraph 的核心哲学"少抽象,多控制。在其他框架试图用高层抽象隐藏复杂性的时候,LangGraph 选择提供最小化的原语——Node(节点)、Edge(边)、State(状态)——让开发者自行组合出任意复杂的执行图。
底层架构:有向图状态机。每个 Node 是一个计算单元(LLM 调用、工具执行、自定义逻辑),Edge 控制执行流向(支持条件分支),State 是在所有节点间共享的持久化数据结构。这种设计灵感来自 Google 的 Pregel 和 Apache Beam。
与其他框架的本质区别:LangGraph 不做架构决策——它不预设 Agent 应该如何思考、如何协作。你需要自己设计状态模式、编排逻辑和错误处理。这带来了最高的灵活性,也意味着最陡峭的学习曲线。正如 LangChain 团队所述:"当我们必须在易用性和生产就绪性之间做取舍时,我们选择了生产就绪性。"
多 Agent 编排:支持单 Agent、多 Agent 层级、并行扇出/扇入模式。通过子图(subgraph)机制,可以将复杂系统拆分为独立可测试的模块。不预设编排模式,开发者完全自定义。
记忆系统:内置 Checkpointer 支持 SQLite、PostgreSQL 等后端的状态持久化。短期记忆通过 State 管理,长期记忆通过 Memory Store 实现跨会话信息保留。Checkpoint 机制还支持"时间旅行"——回溯到任意历史状态进行调试。
工具调用与 MCP:通过 LangChain 生态的丰富工具集集成,原生支持 MCP 工具服务器。
Human-in-the-Loop:内置 interrupt() 函数,可在任意节点暂停执行等待人工审批,恢复后从断点继续。支持状态检查和修改。
流式输出:原生 token 级流式传输,零额外开销。支持多种流式模式(values、updates、events)。
可观测性:内置 Tracing 与 LangSmith 深度集成,提供完整的执行追踪。支持 Mermaid 图可视化执行路径。
部署:LangGraph Platform 提供生产级部署,包含任务队列、水平扩展。也可通过 Docker/K8s 自行部署。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 概念清晰(图、节点、边) | 学习曲线陡峭,有经验团队需 2-3 周才能写出生产级代码 |
灵活性 | 极高——可构建任意拓扑的执行图 | 灵活性带来决策负担,简单场景也需手动设计状态模式 |
生产成熟度 | 业界领先——持久化执行、检查点、错误恢复 | LangGraph Platform 为商业产品,完整生产能力需付费 |
多 Agent 能力 | 支持任意编排模式(层级、并行、条件) | 没有预设的高层多 Agent 抽象,需从零搭建 |
可观测性 | LangSmith 提供一流的调试与评估体验 | LangSmith 为商业服务 |
社区生态 | 最大的 LLM 应用开发社区 | LangChain 历史包袱(早期 API 被广泛批评) |
字段 | 内容 |
|---|---|
开发方 | CrewAI Inc. |
开源协议 | MIT |
主要语言 | Python |
GitHub Stars(约) | 45,900 |
首发时间 | 2024 年初 |
最新版本 | v0.152.x(2026 年 2 月) |
官方定位 | 角色驱动的自主 AI Agent 协作框架 |

CrewAI 的核心哲学是"像组建真实团队一样组建 Agent 团队"。每个 Agent 被赋予 Role(角色)、Goal(目标)和 Backstory(背景故事),通过自然语言描述即可定义一个有个性、有专长的 AI 角色。
底层架构:角色驱动 + 事件驱动双模。CrewAI 提供两种互补的编排方式:
与其他框架的本质区别:CrewAI 完全独立于 LangChain 从零构建,没有外部框架依赖。它的核心价值在于将"多 Agent 协作"这个概念做到了极致的易用性——定义角色、分配任务、启动团队,三步即可运行。
多 Agent 编排:支持顺序(Sequential)、层级(Hierarchical,由 Manager Agent 协调)、共识等多种协作流程。Agent 可以自主委派任务给更专业的同伴。Flows 提供事件驱动的工作流,支持 or_ 和 and_ 逻辑运算符组合触发条件。
记忆系统:内建记忆能力,Agent 可以从历史交互中学习并改进。支持跨会话的经验积累。
工具调用与 MCP:内置 50+ 工具,支持 MCP 工具服务器集成(2026 年 2 月更新中增强了 MCP 工具解析)。
Human-in-the-Loop:Flows 支持 HITL 自循环,Lead Score Flow 示例展示了人工审核流程。
部署:CrewAI AMP Suite 提供企业级部署方案,支持本地和云端部署。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 极低——角色化定义直观易懂,号称一周内从想法到生产 | 高级定制需要深入理解 Flows 机制 |
灵活性 | Crews + Flows 双模覆盖灵活性与控制力 | 底层控制力不如 LangGraph |
生产成熟度 | AMP Suite 提供企业级部署 | 核心框架版本号仍为 0.x,API 变动频繁 |
多 Agent 能力 | 角色委派机制是最直观的多 Agent 协作方案 | 复杂的条件分支和状态管理不如 LangGraph 灵活 |
可观测性 | 内置 verbose 模式 | 缺少类似 LangSmith 的独立可观测平台 |
社区生态 | 增长最快的 Agent 框架之一,活跃度极高 | 第三方集成生态不如 LangChain 丰富 |
字段 | 内容 |
|---|---|
开发方 | LlamaIndex Inc.(原 GPT Index) |
开源协议 | MIT |
主要语言 | Python, TypeScript |
GitHub Stars(约) | 42,000+ |
首发时间 | 2022 年底(作为 GPT Index) |
最新版本 | Workflows 1.0(独立包) |
官方定位 | 数据框架与 Agent 开发平台,专注文档 Agent 和 OCR |

LlamaIndex 的核心哲学是"数据是 Agent 智能的基石"。在其他框架关注编排和协作时,LlamaIndex 深耕数据连接——如何将正确的数据、在正确的时间、以正确的格式送入 LLM。
底层架构:数据框架 + 事件驱动工作流。LlamaIndex 由两个核心层组成:
与其他框架的本质区别:LlamaIndex 不试图做通用 Agent 框架,而是在"数据密集型 Agent"这个垂直领域做到极致。其 LlamaParse 是业界领先的文档解析引擎,支持 130+ 格式。
Workflows 1.0:独立的事件驱动编排引擎,支持分支、循环、并行执行。使用类型化事件在步骤间传递信息,Context 对象管理共享状态。已独立为 llama-index-workflows 包,可脱离 LlamaIndex 核心使用。
RAG 能力:这是 LlamaIndex 的绝对强项。支持混合检索(向量+关键词)、重排序、查询路由、多步查询分解。
记忆系统:通过 Workflows 的 Context 和 State 管理会话记忆。
工具调用与 MCP:支持 MCP 工具集成,丰富的内置工具(代码执行、搜索等)。
文档解析:LlamaParse 支持 130+ 文件格式的高保真解析,包括复杂表格、嵌入图片、手写笔记。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 高层 API 5 行代码即可搭建 RAG | Workflows 的事件驱动范式需要适应 |
灵活性 | 数据层极度模块化 | 通用 Agent 编排不如 LangGraph 灵活 |
生产成熟度 | RAG 管线在金融、法律等领域广泛验证 | Workflows 1.0 刚独立,需更多生产验证 |
多 Agent 能力 | Workflows 支持多 Agent 手动编排 | 没有 CrewAI 那样的高层多 Agent 抽象 |
可观测性 | 支持 OpenTelemetry、Arize Phoenix 集成 | 缺少自建可观测平台 |
社区生态 | 数据连接器生态无人能及 | 作为"Agent 框架"的认知度不如其 RAG 定位 |
字段 | 内容 |
|---|---|
开发方 | Pydantic 团队(Samuel Colvin 等) |
开源协议 | MIT |
主要语言 | Python |
GitHub Stars(约) | 15,500 |
首发时间 | 2024 年底 |
最新版本 | v1.68.0(2026 年 3 月) |
官方定位 | 带来"FastAPI 体验"的 GenAI Agent 框架 |

PydanticAI 的核心哲学是"将类型安全进行到底"。就像 FastAPI 用类型提示革新了 Web 开发,PydanticAI 要让 Agent 开发获得同样的类型安全和开发体验。
底层架构:代码优先 + 依赖注入。PydanticAI 不引入图、状态机等额外抽象,而是让 Agent 就是一个带类型标注的 Python 函数。依赖注入机制让 Agent 保持无状态和可测试,结构化输出带自动重试消除了"静默失败"。
与其他框架的本质区别:PydanticAI 在编译时(开发时)而非运行时捕获错误。支持 25+ 模型提供商,是真正的模型无关框架——切换 LLM 不需要重写业务逻辑。
类型安全:所有输入输出通过 Pydantic 模型验证。结构化输出自动解析和验证,失败时自动重试。
模型无关:支持 OpenAI、Anthropic、Gemini、DeepSeek、Grok、Ollama 等几乎所有主流模型和平台。
依赖注入:FastAPI 风格的 deps 系统,让 Agent 保持无状态、易测试。
工具调用:通过 @agent.tool 装饰器定义工具,类型自动推断。支持 MCP、Toolsets。
可观测性:与 Pydantic Logfire 深度集成,提供 OpenTelemetry 级别的追踪。
测试:内置 TestModel 和 mock 工具,支持确定性测试。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | FastAPI 用户几乎零学习成本 | 不熟悉 Python 类型系统的团队有门槛 |
灵活性 | 底层开放,无过度抽象 | 缺少预建的工作流/管线模板 |
生产成熟度 | 类型安全和结构化输出极大提升可靠性 | v1.x 刚稳定不久 |
多 Agent 能力 | 支持 Agent 委派和 handoff | 缺少原生的多 Agent 编排引擎 |
可观测性 | Logfire 提供一流的 Python 追踪 | Logfire 仍在快速迭代 |
社区生态 | 依托 Pydantic 的巨大用户基础 | Agent 专属社区不如 LangChain 和 CrewAI |
字段 | 内容 |
|---|---|
开发方 | Agno Inc.(原 Phidata) |
开源协议 | Apache-2.0 |
主要语言 | Python |
GitHub Stars(约) | 38,700+ |
首发时间 | 2023 年(作为 Phidata), 2025 年品牌重塑为 Agno |
最新版本 | v2.5.9(2026 年 3 月) |
官方定位 | 构建、运行、管理 Agent 软件的全栈运行时 |

Agno 的核心哲学是"Agent 即基础设施"。不仅提供框架层,还覆盖了运行时(AgentOS)和控制平面(AgentOS UI),形成从开发到部署到运维的完整闭环。
底层架构:三层架构——Framework(构建层)+ AgentOS Runtime(运行层)+ AgentOS Control Plane(监控管理层)。运行时设计为无状态、水平可扩展的 FastAPI 后端。
与其他框架的本质区别:Agno 不只是一个"Python 库",而是一个完整的 Agent 操作系统。你可以在同一套系统中定义 Agent、组建 Team、设计 Workflow,然后用一个命令部署为生产 API。
Agent/Team/Workflow 三级编排:Agent 处理单一任务;Team 协调多个 Agent 协作;Workflow 提供确定性的步骤化执行。
记忆系统:多层记忆架构——Session(会话记忆)、Memory(跨会话记忆)、Knowledge(向量知识库,支持 20+ 向量存储)、Collective Memory(跨 Agent 共享记忆)、Scratchpad(短期推理便签)。

工具与协议:100+ 内置工具包,原生支持 MCP 和 A2A。
AgentOS:将 Agent 系统暴露为 FastAPI 服务,支持 Slack、AI SDK、AG-UI 等接口。
可观测性:原生 OpenTelemetry 支持,AgentOS UI 提供可视化监控。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 极低——号称 2 分钟内启动 Agent | 全栈概念需要时间消化 |
灵活性 | Agent/Team/Workflow 覆盖多种编排需求 | 框架对编排模式有一定预设 |
生产成熟度 | AgentOS 提供完整的部署和运维方案 | 生态知名度不及 LangChain |
多 Agent 能力 | Team 机制直观易用 | 复杂编排不如 LangGraph 灵活 |
可观测性 | AgentOS UI + OTel 原生支持 | UI 还在快速迭代 |
社区生态 | 38k+ Stars,增长迅猛 | 企业案例公开度不如 LangGraph |
字段 | 内容 |
|---|---|
开发方 | Microsoft(Azure AI Foundry 团队) |
开源协议 | MIT |
主要语言 | .NET (C#), Python |
GitHub Stars(约) | AutoGen 50,400 + Semantic Kernel 21,000(合并后新仓库增长中) |
首发时间 | 2025 年 10 月(公开预览) |
最新版本 | Release Candidate(2026 年 2 月 19 日) |
官方定位 | AutoGen + Semantic Kernel 的统一继承者,企业级 Agent SDK |

Microsoft Agent Framework 的核心哲学是"消除实验与生产之间的鸿沟"。它将 AutoGen 的前沿多 Agent 编排研究与 Semantic Kernel 的企业级稳定性融为一体。
底层架构:双模编排——
与其他框架的本质区别:唯一同时原生支持 .NET 和 Python 的主流框架,且与 Azure AI Foundry 深度集成。四大支柱——开放标准互操作(MCP/A2A)、研究到生产管线、企业级安全、社区驱动创新。
图基工作流:类似 LangGraph 的有状态图执行,支持检查点和 HITL。
多 Agent 编排:继承 AutoGen 的群聊(GroupChat)、Magentic-One 等先进模式,并加入企业级持久性保障。
协议支持:原生支持 A2A、AG-UI、MCP 三大标准——这在主流框架中是覆盖最全的。
模型支持:Microsoft Foundry、Azure OpenAI、OpenAI、GitHub Copilot、Anthropic Claude、AWS Bedrock、Ollama。
企业特性:OpenTelemetry 可观测性、Entra ID 认证、长时间运行持久性、人工审批。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 20 行代码即可创建 Agent | RC 状态 API 仍在微调 |
灵活性 | 双模编排(Agent + Workflow)覆盖广 | 在非 Azure 环境下的灵活性受限 |
生产成熟度 | 继承 SK 的企业级安全和遥测 | GA 尚未发布(预计 Q1 2026 末) |
多 Agent 能力 | 继承 AutoGen 的先进群聊和辩论模式 | 迁移成本——现有 AutoGen/SK 用户需要学习新 API |
可观测性 | OpenTelemetry 原生支持 | 缺少自建可视化调试工具 |
社区生态 | 微软的企业背书和资源投入 | 社区仍从 AutoGen/SK 分散迁移中 |
字段 | 内容 |
|---|---|
开发方 | OpenAI |
开源协议 | MIT |
主要语言 | Python, TypeScript |
GitHub Stars(约) | Python 版 17,000+, JS/TS 版增长中 |
首发时间 | 2025 年 3 月 |
最新版本 | 持续更新(支持 WebSocket 模式等) |
官方定位 | 轻量级多 Agent 工作流框架,Swarm 的生产级升级版 |

OpenAI Agents SDK 的核心哲学是"极少抽象,极高效用"。整个框架只有 3 个核心原语:Agent(带指令和工具的 LLM)、Handoff(Agent 间委派)、Guardrail(输入输出校验)。
底层架构:委派驱动的对话流。设计上继承 Swarm 的"Agent 间对话接力"理念——一个 Agent 完成任务后可以将控制权移交给另一个更合适的 Agent。加上 Session 管理、Tracing、Realtime 语音支持。
与其他框架的本质区别:这是 OpenAI 官方出品,意味着与 OpenAI API(Responses API、Chat Completions API)的集成是最原生的。同时支持 100+ 其他 LLM。内置的 Tracing 可直接对接 OpenAI 的评估、微调和蒸馏工具链。
Handoff 机制:核心创新——Agent 可以将对话控制权无缝移交给另一个 Agent。支持 Manager 模式(Agent 作为工具)和 Handoff 模式(去中心化对等委派)。
Guardrails:可配置的输入输出校验层,防止 Agent 行为偏离预期。
Realtime Voice:原生的语音 Agent 支持,包括中断检测、上下文管理、实时流。
Session 管理:内置 SQLite/Redis 会话持久化,自动管理对话历史。
Tracing:内置追踪系统,可直接导入 OpenAI 平台进行评估和微调。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 极低——3 个核心概念,5 行代码启动 | 简单到可能不够用于复杂场景 |
灵活性 | Handoff 模式优雅处理多 Agent 路由 | 缺乏图状态机级别的复杂控制流 |
生产成熟度 | OpenAI 官方维护,质量有保障 | 缺少持久化执行和检查点机制 |
多 Agent 能力 | Handoff 和 Agent-as-tool 两种模式 | 编排模式有限,不支持并行和循环 |
可观测性 | 内置 Tracing 直连 OpenAI 工具链 | 追踪仅在 OpenAI 生态内最优 |
社区生态 | OpenAI 品牌号召力 | 社区驱动的扩展和集成较少 |
字段 | 内容 |
|---|---|
开发方 | |
开源协议 | Apache-2.0 |
主要语言 | Python, TypeScript, Java (Go 开发中) |
GitHub Stars(约) | Python 版快速增长中 |
首发时间 | 2025 年 4 月 |
最新版本 | Python v0.6.0, Java/TS 持续更新 |
官方定位 | 代码优先的 Agent 开发套件,为 Gemini 和 Google 生态优化 |

Google ADK 的核心哲学是"让 Agent 开发像软件开发一样"。强调代码优先、版本控制、自动化测试——将传统软件工程最佳实践引入 Agent 开发。
底层架构:层级化 Agent 组合。提供三类 Agent:
与其他框架的本质区别:唯一同时覆盖 Python、TypeScript、Java(和即将到来的 Go)四种主要语言的框架。与 Vertex AI、Cloud Run 的原生集成使其成为 Google Cloud 企业部署的自然选择。
多 Agent 编排:层级化 Agent 组合——Agent 可以包含子 Agent,LLM 驱动的转移和显式 AgentTool 调用并存。
工具生态:MCP 工具、OpenAPI spec、自定义函数、Google 搜索、代码执行器。2026 年 2 月发布的集成生态扩展包含 GitHub、Hugging Face、n8n 等合作伙伴。
评估系统:内置 Agent 评估框架,支持多轮对话数据集、本地 CLI 和 Dev UI 评估。
部署:支持 Cloud Run 容器化部署和 Vertex AI Agent Engine 托管部署。
Artifact 管理:Agent 可以创建和管理持久化输出物(文件、代码、文档)。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 代码优先设计对开发者友好 | Gemini 特定功能在其他模型上不可用 |
灵活性 | 三类 Agent + 自定义 Agent 覆盖广 | 离开 Google 生态后灵活性下降 |
生产成熟度 | Vertex AI 和 Cloud Run 提供企业级部署 | 框架本身仍为 0.x 版本 |
多 Agent 能力 | 层级化组合模式清晰 | 缺少 AutoGen 级别的群聊/辩论模式 |
可观测性 | 丰富的第三方可观测性合作伙伴 | 缺少自建可观测平台 |
社区生态 | Google 背书 + 四语言支持 | 社区规模远不及 LangChain |
字段 | 内容 |
|---|---|
开发方 | LangGenius Inc. |
开源协议 | Apache-2.0(自部署版) |
主要语言 | Python(后端), TypeScript(前端) |
GitHub Stars(约) | 131,000+ |
首发时间 | 2023 年 |
最新版本 | v1.5.0(2026 年 3 月) |
官方定位 | 生产级 Agent 工作流开发平台 |

Dify 的核心哲学是"让 AI 应用开发民主化"。通过可视化拖拽界面,让非技术人员也能构建复杂的 Agent 工作流。
底层架构:可视化工作流引擎 + Backend-as-a-Service。Dify 不是一个 Python 库,而是一个完整的 Web 平台——包含工作流编辑器、模型管理、知识库管理、API 发布、日志监控等模块。
与其他框架的本质区别:Dify 是本次调研中唯一真正意义上的"低代码平台"。所有其他框架都需要编写代码,Dify 可以完全通过 GUI 构建 Agent 应用。同时提供完整的 Backend-as-a-Service API,支持程序化集成。
可视化工作流:拖拽式 AI 工作流编辑器,支持条件分支、循环、并行执行。
Agent 节点:在工作流中插入 Agent 节点,支持 Function Calling、ReAct、Chain-of-Thought 等推理策略。
RAG 管线:内置知识库管理,支持文档上传、分块、向量化和检索。
模型管理:支持数百种 LLM,一键切换和性能对比。
MCP 支持:2026 年原生集成 MCP——可使用任何 MCP 服务器作为工具,也可将 Dify Agent 暴露为 MCP 服务器。
插件市场:v1.0 之后引入的插件架构,所有模型和工具已迁移为插件形式。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 极低——可视化拖拽,零代码 | 复杂定制仍需理解底层 |
灵活性 | 插件架构提供扩展性 | 受限于可视化编辑器的表达能力 |
生产成熟度 | 280+ 企业商业用户,完善的日志和监控 | 开源版与商业版功能差异 |
多 Agent 能力 | 支持 Agent 节点编排 | 原生多 Agent 协作不如 CrewAI 强 |
可观测性 | 内置日志、注释和性能监控 | 深度调试不如代码框架灵活 |
社区生态 | GitHub 最多 Stars 的 Agent 平台 | 技术深度社区不如 LangChain |
字段 | 内容 |
|---|---|
开发方 | 阿里巴巴通义实验室 (AgentScope-AI) |
开源协议 | Apache-2.0 |
主要语言 | Python, Java |
GitHub Stars(约) | 18,200+ |
首发时间 | 2024 年初 |
最新版本 | v1.0(2025 年 8 月论文),持续更新 |
官方定位 | 构建可见、可理解、可信任的 Agent 应用 |

AgentScope 的核心哲学是"透明可控"。不同于其他框架隐藏复杂性,AgentScope 让每一个 prompt、每一次 API 调用、每一个决策步骤都对开发者可见和可控。
底层架构:Agent 导向编程。将 Agent 视为编程的一等公民,通过 MsgHub(消息中心)和 Pipeline 机制编排多 Agent 对话。支持 ReAct 范式,Agent 可以动态切换工具集。
与其他框架的本质区别:三个突出特点:(1)内置模型微调支持——可以直接在框架内进行 Agent 的强化学习微调;(2)多语言支持——Python + Java 双版本,Java 版针对企业级应用优化;(3)国内生态深度适配——原生支持通义千问、阿里云函数计算部署、DingTalk 等国内平台。
多 Agent 编排:MsgHub 提供灵活的消息路由,Pipeline 支持顺序、并行等执行模式。
记忆系统:抽象化的 LongTermMemoryBase 提供 record/retrieve 操作协议,支持多种后端。ReMe 是独立的记忆管理工具包。
工具与协议:内置工具支持浏览器自动化、文件操作、代码执行、移动设备控制。原生支持 MCP 和 A2A 协议。通过 Nacos 实现 A2A 服务发现。
模型微调:Trinity-RFT 框架提供 LLM 的强化学习微调能力。
运行时:AgentScope Runtime 提供安全沙箱(浏览器/文件/移动端)、Agent-as-a-Service API、无服务器部署。支持阿里云函数计算。
可视化:AgentScope Studio 提供可视化开发和调试环境。
维度 | 优势 | 不足 |
|---|---|---|
上手成本 | 号称 5 分钟内开始构建 | 英文文档质量不如国际框架 |
灵活性 | 所有组件可见可控可替换 | 国际生态集成不如 LangChain 丰富 |
生产成熟度 | Runtime 提供完整的部署方案 | 国际企业落地案例较少 |
多 Agent 能力 | MsgHub 消息机制灵活 | 缺少 CrewAI 那样的高层角色抽象 |
可观测性 | OTel 支持 + Studio 可视化 | Studio 仍在快速迭代 |
社区生态 | 国内社区活跃 | 国际社区较小 |
框架 | 上手难易度 | 多Agent编排 | 生产部署成熟度 | 生态丰富程度 | 可观测性 | 灵活可定制性 |
|---|---|---|---|---|---|---|
LangGraph | 2 | 5 | 5 | 5 | 5 | 5 |
CrewAI | 5 | 4 | 3 | 4 | 3 | 3 |
LlamaIndex | 3 | 3 | 4 | 5 | 4 | 4 |
PydanticAI | 4 | 2 | 4 | 3 | 4 | 4 |
Agno | 4 | 4 | 4 | 3 | 4 | 3 |
MS Agent Framework | 3 | 4 | 4 | 4 | 4 | 4 |
OpenAI Agents SDK | 5 | 3 | 3 | 3 | 4 | 2 |
Google ADK | 3 | 3 | 3 | 3 | 3 | 4 |
Dify | 5 | 3 | 4 | 4 | 4 | 2 |
AgentScope | 3 | 4 | 3 | 3 | 3 | 4 |
评分说明:5=极强/极易/极丰富,1=极弱/极难/极匮乏

图状态机类:LangGraph
角色驱动类:CrewAI、Agno(Team 模式)
事件驱动类:LlamaIndex Workflows、AgentScope
SDK 封装类:OpenAI Agents SDK、PydanticAI
低代码平台类:Dify
企业统一类:Microsoft Agent Framework、Google ADK

第一步:团队技术栈是什么?
第二步:核心使用场景?
第三步:部署要求?
第四步:LLM 偏好?

截至 2026 年 3 月,MCP 已被 10 个框架中的至少 8 个原生支持。MCP 正在成为 Agent 工具调用的"USB 接口"——框架之间的工具互操作壁垒正在消失。 这意味着选型时"工具生态丰富度"的权重下降,因为 MCP 工具可以在任何框架中使用。
A2A 的普及速度不及 MCP。目前原生支持 A2A 的框架包括 Microsoft Agent Framework、Google ADK、AgentScope。CrewAI 和 LangGraph 通过社区插件提供部分支持。A2A 的真正价值在于跨组织的 Agent 互操作,但这需要更长的采纳周期。
Microsoft 合并 AutoGen + Semantic Kernel 是 2025-2026 年最重大的框架整合事件。这确立了一个趋势:未来框架数量会继续减少,存活者将更加强大。 LlamaIndex Workflows 独立成包也反映了"核心能力模块化、可独立复用"的趋势。
OpenAI Agents SDK 的 Realtime Voice Agent 支持、Google ADK 的双向流式音视频、Agno 的多模态输入——语音和视觉正在成为 Agent 的标配能力,而不再是附加功能。


可能成为事实标准的:LangGraph(复杂工作流领域)、PydanticAI(类型安全 Agent 基础设施层)
快速增长的:CrewAI(多 Agent 协作)、Agno(全栈 Agent 平台)
整合期过后有望爆发的:Microsoft Agent Framework(企业级 Agent 的最终归宿)
可能被边缘化的:独立的 AutoGen(已进入维护模式)、不持续投入的小众框架
稳健但定位收窄的:LlamaIndex(继续深耕数据密集型场景)、Google ADK(Google Cloud 生态内)、Dify(低代码平台细分市场领导者)


给独立开发者 / 技术探索者
从 PydanticAI 或 OpenAI Agents SDK 开始——它们的学习曲线最平缓,能让你快速理解 Agent 开发的核心概念。当你需要更复杂的编排时,再学习 LangGraph。不要一上来就选最复杂的框架。
给初创公司技术团队
如果你的产品核心是 AI Agent,选择 LangGraph 作为底层编排引擎,搭配 PydanticAI 的类型安全工具。如果需要快速验证想法,先用 CrewAI 做原型,验证后再迁移到 LangGraph。Agno 的全栈方案也值得考虑——从原型到部署一站式解决。
给大型企业技术委员会
首先明确你的云战略:Azure 企业选 Microsoft Agent Framework,Google Cloud 选 Google ADK,多云/混合云选 LangGraph + Dify 组合。低代码需求用 Dify 赋能业务团队,复杂系统用 LangGraph 保障工程质量。优先考虑 MCP 和 A2A 协议支持,确保未来的互操作能力。评估框架不仅看技术能力,也要看商业模式——开源协议、商业授权、长期维护承诺都是关键决策因素。