Agent框架如何选？10大框架选型的底层逻辑

唐国梁Tommy

发布于 2026-06-25 21:33:42

2690

文章被收录于专栏：TGLTommyAI前沿技术论文TGLTommyAI前沿技术论文

第一章：全景概览

1.1 背景与目的

2024 年被称为 Agent 框架的"寒武纪大爆发"——GitHub 上超过 1000 Stars 的 Agent 相关仓库从 14 个猛增至 89 个，增长 535%。进入 2026 年，格局已显著收敛：优胜劣汰之后，存活者各自占据了清晰的生态位。MCP（Model Context Protocol）标准化、A2A（Agent-to-Agent）协议的兴起、Context Engineering 理念的普及，正在重塑框架竞争的底层逻辑。

本报告对 10 个主流 Agent 开发框架进行系统性技术调研，从架构设计、核心功能、生态成熟度、生产部署能力等维度展开深度分析，旨在帮助工程师和技术决策者在实际项目中做出精准的框架选型。

1.2 全景概述

这 10 个框架覆盖了 Agent 开发的全部范式：LangGraph 以图状态机为核心提供底层控制力；CrewAI 用角色驱动的高层抽象加速多 Agent 协作落地；LlamaIndex 在数据连接和 RAG 领域建立了深厚护城河；PydanticAI 将 Python 类型安全理念引入 Agent 开发；Agno 提供从框架到运行时的全栈方案；Microsoft Agent Framework 统一了 AutoGen 与 Semantic Kernel 的企业级能力；OpenAI Agents SDK 以极简抽象降低入门门槛；Google ADK 为 Gemini 生态构建了代码优先的开发体验；Dify 以可视化低代码平台赋能非技术团队；AgentScope 从阿里巴巴通义实验室出发，强调透明可控与国内生态适配。

1.3 核心结论与选型建议速查表（左滑）

框架	定位	最适合场景	推荐指数
LangGraph	底层图状态机编排引擎	复杂有状态工作流、需要精细控制的生产系统	⭐⭐⭐⭐⭐
CrewAI	角色驱动的多 Agent 协作框架	内容生产、研究分析、快速原型	⭐⭐⭐⭐
LlamaIndex	数据密集型 Agent 与 RAG 框架	企业知识库、文档问答、数据检索 Agent	⭐⭐⭐⭐⭐
PydanticAI	类型安全的轻量 Agent 框架	需要强类型保障的生产 Agent、API 集成	⭐⭐⭐⭐
Agno	全栈 Agent 运行时平台	需要快速从原型到生产、全栈 Agent 系统	⭐⭐⭐⭐
Microsoft Agent Framework	企业级统一 Agent SDK	Azure 生态企业部署、.NET/Python 双栈团队	⭐⭐⭐⭐
OpenAI Agents SDK	极简 Agent 开发工具包	OpenAI 模型快速开发、语音 Agent、轻量多 Agent	⭐⭐⭐⭐
Google ADK	Google 生态 Agent 开发套件	Gemini 生态开发、Google Cloud 部署、多语言团队	⭐⭐⭐½
Dify	可视化低代码 Agent 平台	非技术团队、快速 POC、私有化部署	⭐⭐⭐⭐
AgentScope	透明可控的多 Agent 框架	国内企业私有化、阿里云生态、学术研究	⭐⭐⭐½

第二章：Agent 框架技术背景

2.1 什么是 Agent 开发框架

Agent 开发框架是为构建基于大语言模型（LLM）的自主代理系统而设计的软件工具包。与传统的 LLM 应用（如聊天机器人）不同，Agent 具备感知环境、自主决策、使用工具、多步推理的能力。一个 Agent 框架通常包含以下核心组件：

Agent 抽象层：定义 Agent 的身份（指令、角色）、能力边界和行为模式
编排引擎：控制单 Agent 或多 Agent 的执行流程（顺序、并行、条件分支、循环）
工具系统：让 Agent 调用外部 API、数据库、代码执行器等
记忆系统：短期（会话内）、长期（跨会话）、工作记忆的管理
状态管理：在多步执行中持久化和恢复 Agent 的运行状态
可观测性：追踪、日志、调试和评估 Agent 行为的能力

2.2 2024-2026 年关键技术演进趋势

MCP（Model Context Protocol）标准化：由 Anthropic 在 2024 年底提出，MCP 定义了 LLM 与外部工具/数据源交互的标准协议。到 2026 年 3 月，几乎所有主流框架都已支持 MCP，它正在成为 Agent 工具调用的事实标准，取代了此前各框架自定义的工具接口。

A2A（Agent-to-Agent）协议：由 Google 在 2025 年提出，A2A 定义了不同框架构建的 Agent 之间的通信标准。Microsoft Agent Framework、Google ADK、AgentScope 已原生支持 A2A，这标志着 Agent 生态从"框架孤岛"走向"互操作网络"。

Context Engineering：2025 年兴起的理念，强调精心管理传入 LLM 上下文窗口的信息质量和结构，而非仅依赖 prompt engineering。这推动了框架在记忆压缩、上下文过滤、动态工具选择等方面的创新。

Human-in-the-Loop（HITL）成熟化：从早期的"确认/拒绝"二选一，进化为支持中断/恢复、状态检查点、分级审批等精细化人机协同模式。LangGraph 和 Microsoft Agent Framework 在此方面领先。

框架融合趋势：2025 年 10 月 Microsoft 宣布合并 AutoGen 与 Semantic Kernel，2026 年 2 月达到 Release Candidate 状态，标志着行业从"百花齐放"走向"整合收敛"。

2.3 评估 Agent 框架的核心维度

本报告从以下 7 个维度评估各框架：

架构设计：底层范式的合理性与表达力
多 Agent 编排能力：支持的协作模式、通信机制的丰富度
记忆管理：短期/长期/跨会话记忆的完整度
工具调用与协议支持：MCP、A2A、自定义工具的生态
可观测性与调试能力：Tracing、Logging、可视化调试
生产部署成熟度：容错、持久化执行、水平扩展、K8s 支持
生态与社区：模型支持广度、集成丰富度、社区活跃度

第三章：框架逐一深度分析

3.1 LangGraph

3.1.1 基本信息

字段	内容
开发方	LangChain Inc.
开源协议	MIT
主要语言	Python, TypeScript
GitHub Stars（约）	24,600（Python）+ 2,400（JS）
首发时间	2024 年初
最新版本	v1.1.x（2026 年 3 月）
官方定位	低层级 Agent 编排框架，专为生产环境构建

3.1.2 核心设计理念与架构

LangGraph 的核心哲学"少抽象，多控制。在其他框架试图用高层抽象隐藏复杂性的时候，LangGraph 选择提供最小化的原语——Node（节点）、Edge（边）、State（状态）——让开发者自行组合出任意复杂的执行图。

底层架构：有向图状态机。每个 Node 是一个计算单元（LLM 调用、工具执行、自定义逻辑），Edge 控制执行流向（支持条件分支），State 是在所有节点间共享的持久化数据结构。这种设计灵感来自 Google 的 Pregel 和 Apache Beam。

与其他框架的本质区别：LangGraph 不做架构决策——它不预设 Agent 应该如何思考、如何协作。你需要自己设计状态模式、编排逻辑和错误处理。这带来了最高的灵活性，也意味着最陡峭的学习曲线。正如 LangChain 团队所述："当我们必须在易用性和生产就绪性之间做取舍时，我们选择了生产就绪性。"

3.1.3 核心功能特性

多 Agent 编排：支持单 Agent、多 Agent 层级、并行扇出/扇入模式。通过子图（subgraph）机制，可以将复杂系统拆分为独立可测试的模块。不预设编排模式，开发者完全自定义。

记忆系统：内置 Checkpointer 支持 SQLite、PostgreSQL 等后端的状态持久化。短期记忆通过 State 管理，长期记忆通过 Memory Store 实现跨会话信息保留。Checkpoint 机制还支持"时间旅行"——回溯到任意历史状态进行调试。

工具调用与 MCP：通过 LangChain 生态的丰富工具集集成，原生支持 MCP 工具服务器。

Human-in-the-Loop：内置 interrupt() 函数，可在任意节点暂停执行等待人工审批，恢复后从断点继续。支持状态检查和修改。

流式输出：原生 token 级流式传输，零额外开销。支持多种流式模式（values、updates、events）。

可观测性：内置 Tracing 与 LangSmith 深度集成，提供完整的执行追踪。支持 Mermaid 图可视化执行路径。

部署：LangGraph Platform 提供生产级部署，包含任务队列、水平扩展。也可通过 Docker/K8s 自行部署。

3.1.4 生态与集成

LLM 模型：通过 LangChain 集成，支持 OpenAI、Anthropic、Google、开源模型等几乎所有主流 LLM
向量数据库：Pinecone、Weaviate、Chroma、pgvector 等
周边工具：LangSmith（可观测/评估）、LangGraph Platform（部署）、LangGraph Studio（可视化调试）
社区活跃度：LangChain 主仓库 126k Stars，Discord 社区活跃，LangChain Academy 提供免费课程。企业用户包括 Klarna、Replit、Elastic、Uber、LinkedIn

3.1.5 优势与不足（左滑）

维度	优势	不足
上手成本	概念清晰（图、节点、边）	学习曲线陡峭，有经验团队需 2-3 周才能写出生产级代码
灵活性	极高——可构建任意拓扑的执行图	灵活性带来决策负担，简单场景也需手动设计状态模式
生产成熟度	业界领先——持久化执行、检查点、错误恢复	LangGraph Platform 为商业产品，完整生产能力需付费
多 Agent 能力	支持任意编排模式（层级、并行、条件）	没有预设的高层多 Agent 抽象，需从零搭建
可观测性	LangSmith 提供一流的调试与评估体验	LangSmith 为商业服务
社区生态	最大的 LLM 应用开发社区	LangChain 历史包袱（早期 API 被广泛批评）

3.2 CrewAI

3.2.1 基本信息

字段	内容
开发方	CrewAI Inc.
开源协议	MIT
主要语言	Python
GitHub Stars（约）	45,900
首发时间	2024 年初
最新版本	v0.152.x（2026 年 2 月）
官方定位	角色驱动的自主 AI Agent 协作框架

3.2.2 核心设计理念与架构

CrewAI 的核心哲学是"像组建真实团队一样组建 Agent 团队"。每个 Agent 被赋予 Role（角色）、Goal（目标）和 Backstory（背景故事），通过自然语言描述即可定义一个有个性、有专长的 AI 角色。

底层架构：角色驱动 + 事件驱动双模。CrewAI 提供两种互补的编排方式：

Crews（团队）：强调自主性和协作智能，Agent 之间可以自主委派任务
Flows（流程）：事件驱动的工作流引擎，提供精确的控制路径和状态管理

与其他框架的本质区别：CrewAI 完全独立于 LangChain 从零构建，没有外部框架依赖。它的核心价值在于将"多 Agent 协作"这个概念做到了极致的易用性——定义角色、分配任务、启动团队，三步即可运行。

3.2.3 核心功能特性

多 Agent 编排：支持顺序（Sequential）、层级（Hierarchical，由 Manager Agent 协调）、共识等多种协作流程。Agent 可以自主委派任务给更专业的同伴。Flows 提供事件驱动的工作流，支持 or_ 和 and_ 逻辑运算符组合触发条件。

记忆系统：内建记忆能力，Agent 可以从历史交互中学习并改进。支持跨会话的经验积累。

工具调用与 MCP：内置 50+ 工具，支持 MCP 工具服务器集成（2026 年 2 月更新中增强了 MCP 工具解析）。

Human-in-the-Loop：Flows 支持 HITL 自循环，Lead Score Flow 示例展示了人工审核流程。

部署：CrewAI AMP Suite 提供企业级部署方案，支持本地和云端部署。

3.2.4 生态与集成

LLM 模型：模型无关，支持 OpenAI、Anthropic、Gemini、开源模型
第三方集成：支持 LlamaIndex、LangChain Agent 加入 Crew
企业工具：AMP 套件集成 Gmail、Slack、Salesforce 触发器
社区：超过 10 万开发者通过 learn.crewai.com 完成认证课程，社区极为活跃

3.2.6 优势与不足（左滑）

维度	优势	不足
上手成本	极低——角色化定义直观易懂，号称一周内从想法到生产	高级定制需要深入理解 Flows 机制
灵活性	Crews + Flows 双模覆盖灵活性与控制力	底层控制力不如 LangGraph
生产成熟度	AMP Suite 提供企业级部署	核心框架版本号仍为 0.x，API 变动频繁
多 Agent 能力	角色委派机制是最直观的多 Agent 协作方案	复杂的条件分支和状态管理不如 LangGraph 灵活
可观测性	内置 verbose 模式	缺少类似 LangSmith 的独立可观测平台
社区生态	增长最快的 Agent 框架之一，活跃度极高	第三方集成生态不如 LangChain 丰富

3.3 LlamaIndex

3.3.1 基本信息

字段	内容
开发方	LlamaIndex Inc.（原 GPT Index）
开源协议	MIT
主要语言	Python, TypeScript
GitHub Stars（约）	42,000+
首发时间	2022 年底（作为 GPT Index）
最新版本	Workflows 1.0（独立包）
官方定位	数据框架与 Agent 开发平台，专注文档 Agent 和 OCR

3.3.2 核心设计理念与架构

LlamaIndex 的核心哲学是"数据是 Agent 智能的基石"。在其他框架关注编排和协作时，LlamaIndex 深耕数据连接——如何将正确的数据、在正确的时间、以正确的格式送入 LLM。

底层架构：数据框架 + 事件驱动工作流。LlamaIndex 由两个核心层组成：

数据层：300+ 数据连接器、丰富的索引结构、先进的检索引擎
编排层：Workflows 1.0——事件驱动、异步优先、步骤化的执行引擎

与其他框架的本质区别：LlamaIndex 不试图做通用 Agent 框架，而是在"数据密集型 Agent"这个垂直领域做到极致。其 LlamaParse 是业界领先的文档解析引擎，支持 130+ 格式。

3.3.3 核心功能特性

Workflows 1.0：独立的事件驱动编排引擎，支持分支、循环、并行执行。使用类型化事件在步骤间传递信息，Context 对象管理共享状态。已独立为 llama-index-workflows 包，可脱离 LlamaIndex 核心使用。

RAG 能力：这是 LlamaIndex 的绝对强项。支持混合检索（向量+关键词）、重排序、查询路由、多步查询分解。

记忆系统：通过 Workflows 的 Context 和 State 管理会话记忆。

工具调用与 MCP：支持 MCP 工具集成，丰富的内置工具（代码执行、搜索等）。

文档解析：LlamaParse 支持 130+ 文件格式的高保真解析，包括复杂表格、嵌入图片、手写笔记。

3.3.4 生态与集成

数据连接：LlamaHub 提供 300+ 社区贡献的数据连接器
向量数据库：几乎支持所有主流向量数据库
商业服务：LlamaCloud（托管服务）、LlamaParse（文档解析）
社区：40,000+ Stars，活跃的开源社区

3.3.5 优势与不足（左滑）

维度	优势	不足
上手成本	高层 API 5 行代码即可搭建 RAG	Workflows 的事件驱动范式需要适应
灵活性	数据层极度模块化	通用 Agent 编排不如 LangGraph 灵活
生产成熟度	RAG 管线在金融、法律等领域广泛验证	Workflows 1.0 刚独立，需更多生产验证
多 Agent 能力	Workflows 支持多 Agent 手动编排	没有 CrewAI 那样的高层多 Agent 抽象
可观测性	支持 OpenTelemetry、Arize Phoenix 集成	缺少自建可观测平台
社区生态	数据连接器生态无人能及	作为"Agent 框架"的认知度不如其 RAG 定位

3.4 PydanticAI

3.4.1 基本信息

字段	内容
开发方	Pydantic 团队（Samuel Colvin 等）
开源协议	MIT
主要语言	Python
GitHub Stars（约）	15,500
首发时间	2024 年底
最新版本	v1.68.0（2026 年 3 月）
官方定位	带来"FastAPI 体验"的 GenAI Agent 框架

3.4.2 核心设计理念与架构

PydanticAI 的核心哲学是"将类型安全进行到底"。就像 FastAPI 用类型提示革新了 Web 开发，PydanticAI 要让 Agent 开发获得同样的类型安全和开发体验。

底层架构：代码优先 + 依赖注入。PydanticAI 不引入图、状态机等额外抽象，而是让 Agent 就是一个带类型标注的 Python 函数。依赖注入机制让 Agent 保持无状态和可测试，结构化输出带自动重试消除了"静默失败"。

与其他框架的本质区别：PydanticAI 在编译时（开发时）而非运行时捕获错误。支持 25+ 模型提供商，是真正的模型无关框架——切换 LLM 不需要重写业务逻辑。

3.4.3 核心功能特性

类型安全：所有输入输出通过 Pydantic 模型验证。结构化输出自动解析和验证，失败时自动重试。

模型无关：支持 OpenAI、Anthropic、Gemini、DeepSeek、Grok、Ollama 等几乎所有主流模型和平台。

依赖注入：FastAPI 风格的 deps 系统，让 Agent 保持无状态、易测试。

工具调用：通过 @agent.tool 装饰器定义工具，类型自动推断。支持 MCP、Toolsets。

可观测性：与 Pydantic Logfire 深度集成，提供 OpenTelemetry 级别的追踪。

测试：内置 TestModel 和 mock 工具，支持确定性测试。

3.4.4 生态与集成

LLM：25+ 提供商，包括 Azure AI Foundry、AWS Bedrock、Vertex AI
可观测性：Pydantic Logfire（自家产品，4,100 Stars）
安全沙箱：Monty——Rust 编写的最小 Python 解释器（6,300 Stars）
社区：增速最快的新兴框架之一

3.4.5 优势与不足（左滑）

维度	优势	不足
上手成本	FastAPI 用户几乎零学习成本	不熟悉 Python 类型系统的团队有门槛
灵活性	底层开放，无过度抽象	缺少预建的工作流/管线模板
生产成熟度	类型安全和结构化输出极大提升可靠性	v1.x 刚稳定不久
多 Agent 能力	支持 Agent 委派和 handoff	缺少原生的多 Agent 编排引擎
可观测性	Logfire 提供一流的 Python 追踪	Logfire 仍在快速迭代
社区生态	依托 Pydantic 的巨大用户基础	Agent 专属社区不如 LangChain 和 CrewAI

3.5 Agno

3.5.1 基本信息

字段	内容
开发方	Agno Inc.（原 Phidata）
开源协议	Apache-2.0
主要语言	Python
GitHub Stars（约）	38,700+
首发时间	2023 年（作为 Phidata）, 2025 年品牌重塑为 Agno
最新版本	v2.5.9（2026 年 3 月）
官方定位	构建、运行、管理 Agent 软件的全栈运行时

3.5.2 核心设计理念与架构

Agno 的核心哲学是"Agent 即基础设施"。不仅提供框架层，还覆盖了运行时（AgentOS）和控制平面（AgentOS UI），形成从开发到部署到运维的完整闭环。

底层架构：三层架构——Framework（构建层）+ AgentOS Runtime（运行层）+ AgentOS Control Plane（监控管理层）。运行时设计为无状态、水平可扩展的 FastAPI 后端。

与其他框架的本质区别：Agno 不只是一个"Python 库"，而是一个完整的 Agent 操作系统。你可以在同一套系统中定义 Agent、组建 Team、设计 Workflow，然后用一个命令部署为生产 API。

3.5.3 核心功能特性

Agent/Team/Workflow 三级编排：Agent 处理单一任务；Team 协调多个 Agent 协作；Workflow 提供确定性的步骤化执行。

记忆系统：多层记忆架构——Session（会话记忆）、Memory（跨会话记忆）、Knowledge（向量知识库，支持 20+ 向量存储）、Collective Memory（跨 Agent 共享记忆）、Scratchpad（短期推理便签）。

工具与协议：100+ 内置工具包，原生支持 MCP 和 A2A。

AgentOS：将 Agent 系统暴露为 FastAPI 服务，支持 Slack、AI SDK、AG-UI 等接口。

可观测性：原生 OpenTelemetry 支持，AgentOS UI 提供可视化监控。

3.5.4 生态与集成

LLM：OpenAI、Anthropic、Gemini、开源模型通过 Ollama
向量存储：20+ 向量数据库支持
参考应用：Pal（个人助手）、Dash（数据 Agent）、Scout（企业知识 Agent）、Gcode（编码 Agent）
部署模板：AWS、Docker 部署模板

3.5.5 优势与不足（左滑）

维度	优势	不足
上手成本	极低——号称 2 分钟内启动 Agent	全栈概念需要时间消化
灵活性	Agent/Team/Workflow 覆盖多种编排需求	框架对编排模式有一定预设
生产成熟度	AgentOS 提供完整的部署和运维方案	生态知名度不及 LangChain
多 Agent 能力	Team 机制直观易用	复杂编排不如 LangGraph 灵活
可观测性	AgentOS UI + OTel 原生支持	UI 还在快速迭代
社区生态	38k+ Stars，增长迅猛	企业案例公开度不如 LangGraph

3.6 Microsoft Agent Framework

3.6.1 基本信息

字段	内容
开发方	Microsoft（Azure AI Foundry 团队）
开源协议	MIT
主要语言	.NET (C#), Python
GitHub Stars（约）	AutoGen 50,400 + Semantic Kernel 21,000（合并后新仓库增长中）
首发时间	2025 年 10 月（公开预览）
最新版本	Release Candidate（2026 年 2 月 19 日）
官方定位	AutoGen + Semantic Kernel 的统一继承者，企业级 Agent SDK

3.6.2 核心设计理念与架构

Microsoft Agent Framework 的核心哲学是"消除实验与生产之间的鸿沟"。它将 AutoGen 的前沿多 Agent 编排研究与 Semantic Kernel 的企业级稳定性融为一体。

底层架构：双模编排——

Agent Orchestration（AutoGen 精神）：LLM 驱动的动态推理和多 Agent 协作，支持群聊、辩论、反思等模式
Workflow Orchestration（Semantic Kernel DNA）：确定性的业务流程编排，支持顺序、并行、条件分支

与其他框架的本质区别：唯一同时原生支持 .NET 和 Python 的主流框架，且与 Azure AI Foundry 深度集成。四大支柱——开放标准互操作（MCP/A2A）、研究到生产管线、企业级安全、社区驱动创新。

3.6.3 核心功能特性

图基工作流：类似 LangGraph 的有状态图执行，支持检查点和 HITL。

多 Agent 编排：继承 AutoGen 的群聊（GroupChat）、Magentic-One 等先进模式，并加入企业级持久性保障。

协议支持：原生支持 A2A、AG-UI、MCP 三大标准——这在主流框架中是覆盖最全的。

模型支持：Microsoft Foundry、Azure OpenAI、OpenAI、GitHub Copilot、Anthropic Claude、AWS Bedrock、Ollama。

企业特性：OpenTelemetry 可观测性、Entra ID 认证、长时间运行持久性、人工审批。

3.6.4 生态与集成

Azure 生态：与 Azure AI Foundry Agent Service 深度集成
Microsoft 365：与 Microsoft 365 Agents SDK 共享运行时
存储后端：Redis、Pinecone 等可插拔记忆模块
社区：Azure AI Foundry Discord 活跃

3.6.5 优势与不足（左滑）

维度	优势	不足
上手成本	20 行代码即可创建 Agent	RC 状态 API 仍在微调
灵活性	双模编排（Agent + Workflow）覆盖广	在非 Azure 环境下的灵活性受限
生产成熟度	继承 SK 的企业级安全和遥测	GA 尚未发布（预计 Q1 2026 末）
多 Agent 能力	继承 AutoGen 的先进群聊和辩论模式	迁移成本——现有 AutoGen/SK 用户需要学习新 API
可观测性	OpenTelemetry 原生支持	缺少自建可视化调试工具
社区生态	微软的企业背书和资源投入	社区仍从 AutoGen/SK 分散迁移中

3.7 OpenAI Agents SDK

3.7.1 基本信息

字段	内容
开发方	OpenAI
开源协议	MIT
主要语言	Python, TypeScript
GitHub Stars（约）	Python 版 17,000+, JS/TS 版增长中
首发时间	2025 年 3 月
最新版本	持续更新（支持 WebSocket 模式等）
官方定位	轻量级多 Agent 工作流框架，Swarm 的生产级升级版

3.7.2 核心设计理念与架构

OpenAI Agents SDK 的核心哲学是"极少抽象，极高效用"。整个框架只有 3 个核心原语：Agent（带指令和工具的 LLM）、Handoff（Agent 间委派）、Guardrail（输入输出校验）。

底层架构：委派驱动的对话流。设计上继承 Swarm 的"Agent 间对话接力"理念——一个 Agent 完成任务后可以将控制权移交给另一个更合适的 Agent。加上 Session 管理、Tracing、Realtime 语音支持。

与其他框架的本质区别：这是 OpenAI 官方出品，意味着与 OpenAI API（Responses API、Chat Completions API）的集成是最原生的。同时支持 100+ 其他 LLM。内置的 Tracing 可直接对接 OpenAI 的评估、微调和蒸馏工具链。

3.7.3 核心功能特性

Handoff 机制：核心创新——Agent 可以将对话控制权无缝移交给另一个 Agent。支持 Manager 模式（Agent 作为工具）和 Handoff 模式（去中心化对等委派）。

Guardrails：可配置的输入输出校验层，防止 Agent 行为偏离预期。

Realtime Voice：原生的语音 Agent 支持，包括中断检测、上下文管理、实时流。

Session 管理：内置 SQLite/Redis 会话持久化，自动管理对话历史。

Tracing：内置追踪系统，可直接导入 OpenAI 平台进行评估和微调。

3.7.4 生态与集成

LLM：OpenAI 全系列（包括 GPT-5.x）+ 100+ 其他模型
工具：MCP 工具、Hosted Tools、自定义函数工具
语音：Realtime API 深度集成
开发工具：与 OpenAI Platform 的评估/微调/蒸馏工具链无缝衔接

3.7.5 优势与不足（左滑）

维度	优势	不足
上手成本	极低——3 个核心概念，5 行代码启动	简单到可能不够用于复杂场景
灵活性	Handoff 模式优雅处理多 Agent 路由	缺乏图状态机级别的复杂控制流
生产成熟度	OpenAI 官方维护，质量有保障	缺少持久化执行和检查点机制
多 Agent 能力	Handoff 和 Agent-as-tool 两种模式	编排模式有限，不支持并行和循环
可观测性	内置 Tracing 直连 OpenAI 工具链	追踪仅在 OpenAI 生态内最优
社区生态	OpenAI 品牌号召力	社区驱动的扩展和集成较少

3.8 Google ADK（Agent Development Kit）

3.8.1 基本信息

字段	内容
开发方	Google
开源协议	Apache-2.0
主要语言	Python, TypeScript, Java (Go 开发中)
GitHub Stars（约）	Python 版快速增长中
首发时间	2025 年 4 月
最新版本	Python v0.6.0, Java/TS 持续更新
官方定位	代码优先的 Agent 开发套件，为 Gemini 和 Google 生态优化

3.8.2 核心设计理念与架构

Google ADK 的核心哲学是"让 Agent 开发像软件开发一样"。强调代码优先、版本控制、自动化测试——将传统软件工程最佳实践引入 Agent 开发。

底层架构：层级化 Agent 组合。提供三类 Agent：

LlmAgent：LLM 驱动的智能推理 Agent
Workflow Agent：SequentialAgent、ParallelAgent、LoopAgent 三种确定性编排器
Custom Agent：继承 BaseAgent 实现自定义逻辑

与其他框架的本质区别：唯一同时覆盖 Python、TypeScript、Java（和即将到来的 Go）四种主要语言的框架。与 Vertex AI、Cloud Run 的原生集成使其成为 Google Cloud 企业部署的自然选择。

3.8.3 核心功能特性

多 Agent 编排：层级化 Agent 组合——Agent 可以包含子 Agent，LLM 驱动的转移和显式 AgentTool 调用并存。

工具生态：MCP 工具、OpenAPI spec、自定义函数、Google 搜索、代码执行器。2026 年 2 月发布的集成生态扩展包含 GitHub、Hugging Face、n8n 等合作伙伴。

评估系统：内置 Agent 评估框架，支持多轮对话数据集、本地 CLI 和 Dev UI 评估。

部署：支持 Cloud Run 容器化部署和 Vertex AI Agent Engine 托管部署。

Artifact 管理：Agent 可以创建和管理持久化输出物（文件、代码、文档）。

3.8.4 生态与集成

模型：为 Gemini 优化，但支持通过 BaseLlm 接口接入其他模型
可观测性伙伴：AgentOps、Arize AX、MLflow、Phoenix、W&B Weave
集成平台：n8n、StackOne（200+ SaaS）
多语言：Python/TypeScript/Java/Go 四语言支持

3.8.5 优势与不足（左滑）

维度	优势	不足
上手成本	代码优先设计对开发者友好	Gemini 特定功能在其他模型上不可用
灵活性	三类 Agent + 自定义 Agent 覆盖广	离开 Google 生态后灵活性下降
生产成熟度	Vertex AI 和 Cloud Run 提供企业级部署	框架本身仍为 0.x 版本
多 Agent 能力	层级化组合模式清晰	缺少 AutoGen 级别的群聊/辩论模式
可观测性	丰富的第三方可观测性合作伙伴	缺少自建可观测平台
社区生态	Google 背书 + 四语言支持	社区规模远不及 LangChain

3.9 Dify

3.9.1 基本信息

字段	内容
开发方	LangGenius Inc.
开源协议	Apache-2.0（自部署版）
主要语言	Python（后端）, TypeScript（前端）
GitHub Stars（约）	131,000+
首发时间	2023 年
最新版本	v1.5.0（2026 年 3 月）
官方定位	生产级 Agent 工作流开发平台

3.9.2 核心设计理念与架构

Dify 的核心哲学是"让 AI 应用开发民主化"。通过可视化拖拽界面，让非技术人员也能构建复杂的 Agent 工作流。

底层架构：可视化工作流引擎 + Backend-as-a-Service。Dify 不是一个 Python 库，而是一个完整的 Web 平台——包含工作流编辑器、模型管理、知识库管理、API 发布、日志监控等模块。

与其他框架的本质区别：Dify 是本次调研中唯一真正意义上的"低代码平台"。所有其他框架都需要编写代码，Dify 可以完全通过 GUI 构建 Agent 应用。同时提供完整的 Backend-as-a-Service API，支持程序化集成。

3.9.3 核心功能特性

可视化工作流：拖拽式 AI 工作流编辑器，支持条件分支、循环、并行执行。

Agent 节点：在工作流中插入 Agent 节点，支持 Function Calling、ReAct、Chain-of-Thought 等推理策略。

RAG 管线：内置知识库管理，支持文档上传、分块、向量化和检索。

模型管理：支持数百种 LLM，一键切换和性能对比。

MCP 支持：2026 年原生集成 MCP——可使用任何 MCP 服务器作为工具，也可将 Dify Agent 暴露为 MCP 服务器。

插件市场：v1.0 之后引入的插件架构，所有模型和工具已迁移为插件形式。

3.9.4 生态与集成

LLM：支持 OpenAI、Anthropic、Gemini、国内模型（通义千问等）、开源模型（通过 Ollama）
部署：Docker 自部署、Dify Cloud 托管、AWS Marketplace
企业客户：Maersk、ETS、Anker Innovations、Novartis
社区：GitHub 131k+ Stars（全球第 51 名），运行在超过 140 万台机器上

3.9.5 优势与不足（左滑）

维度	优势	不足
上手成本	极低——可视化拖拽，零代码	复杂定制仍需理解底层
灵活性	插件架构提供扩展性	受限于可视化编辑器的表达能力
生产成熟度	280+ 企业商业用户，完善的日志和监控	开源版与商业版功能差异
多 Agent 能力	支持 Agent 节点编排	原生多 Agent 协作不如 CrewAI 强
可观测性	内置日志、注释和性能监控	深度调试不如代码框架灵活
社区生态	GitHub 最多 Stars 的 Agent 平台	技术深度社区不如 LangChain

3.10 AgentScope

3.10.1 基本信息

字段	内容
开发方	阿里巴巴通义实验室 (AgentScope-AI)
开源协议	Apache-2.0
主要语言	Python, Java
GitHub Stars（约）	18,200+
首发时间	2024 年初
最新版本	v1.0（2025 年 8 月论文），持续更新
官方定位	构建可见、可理解、可信任的 Agent 应用

3.10.2 核心设计理念与架构

AgentScope 的核心哲学是"透明可控"。不同于其他框架隐藏复杂性，AgentScope 让每一个 prompt、每一次 API 调用、每一个决策步骤都对开发者可见和可控。

底层架构：Agent 导向编程。将 Agent 视为编程的一等公民，通过 MsgHub（消息中心）和 Pipeline 机制编排多 Agent 对话。支持 ReAct 范式，Agent 可以动态切换工具集。

与其他框架的本质区别：三个突出特点：（1）内置模型微调支持——可以直接在框架内进行 Agent 的强化学习微调；（2）多语言支持——Python + Java 双版本，Java 版针对企业级应用优化；（3）国内生态深度适配——原生支持通义千问、阿里云函数计算部署、DingTalk 等国内平台。

3.10.3 核心功能特性

多 Agent 编排：MsgHub 提供灵活的消息路由，Pipeline 支持顺序、并行等执行模式。

记忆系统：抽象化的 LongTermMemoryBase 提供 record/retrieve 操作协议，支持多种后端。ReMe 是独立的记忆管理工具包。

工具与协议：内置工具支持浏览器自动化、文件操作、代码执行、移动设备控制。原生支持 MCP 和 A2A 协议。通过 Nacos 实现 A2A 服务发现。

模型微调：Trinity-RFT 框架提供 LLM 的强化学习微调能力。

运行时：AgentScope Runtime 提供安全沙箱（浏览器/文件/移动端）、Agent-as-a-Service API、无服务器部署。支持阿里云函数计算。

可视化：AgentScope Studio 提供可视化开发和调试环境。

3.10.4 生态与集成

LLM：通义千问、OpenAI、Anthropic、开源模型（通过 Ollama）
部署：阿里云函数计算（Serverless）、K8s、本地 Docker
产品矩阵：CoPaw（个人助手，12k Stars）、ReMe（记忆管理）、OpenJudge（评估框架）、Trinity-RFT（微调）
国内平台：DingTalk、Lark（飞书）、QQ、微信（通过 CoPaw）

3.10.5 优势与不足（左滑）

维度	优势	不足
上手成本	号称 5 分钟内开始构建	英文文档质量不如国际框架
灵活性	所有组件可见可控可替换	国际生态集成不如 LangChain 丰富
生产成熟度	Runtime 提供完整的部署方案	国际企业落地案例较少
多 Agent 能力	MsgHub 消息机制灵活	缺少 CrewAI 那样的高层角色抽象
可观测性	OTel 支持 + Studio 可视化	Studio 仍在快速迭代
社区生态	国内社区活跃	国际社区较小

第四章：横向对比分析

4.1 核心能力评分表（左滑）

框架	上手难易度	多Agent编排	生产部署成熟度	生态丰富程度	可观测性	灵活可定制性
LangGraph	2	5	5	5	5	5
CrewAI	5	4	3	4	3	3
LlamaIndex	3	3	4	5	4	4
PydanticAI	4	2	4	3	4	4
Agno	4	4	4	3	4	3
MS Agent Framework	3	4	4	4	4	4
OpenAI Agents SDK	5	3	3	3	4	2
Google ADK	3	3	3	3	3	4
Dify	5	3	4	4	4	2
AgentScope	3	4	3	3	3	4

评分说明：5=极强/极易/极丰富，1=极弱/极难/极匮乏

4.2 架构范式分类对比

图状态机类：LangGraph

优势：最高的表达力和控制力，可构建任意拓扑的执行流
劣势：学习曲线最陡，简单场景也需设计状态模式
适用：需要精确控制的复杂有状态系统

角色驱动类：CrewAI、Agno（Team 模式）

优势：直观、易上手、贴近人类团队协作的思维模式
劣势：底层控制力有限，复杂条件逻辑表达受限
适用：内容生产、研究分析等角色化协作场景

事件驱动类：LlamaIndex Workflows、AgentScope

优势：异步原生、解耦良好、易于扩展
劣势：事件流的调试和理解不如线性流程直观
适用：数据管线、异步处理、多步检索

SDK 封装类：OpenAI Agents SDK、PydanticAI

优势：极简抽象、零学习负担、与模型提供商 API 深度集成
劣势：编排能力有限，复杂场景需搭配其他框架
适用：快速开发、轻量 Agent、特定模型生态

低代码平台类：Dify

优势：非技术人员可用、可视化直观、快速部署
劣势：灵活性最受限、高级定制需降级到代码
适用：企业 AI 民主化、快速 POC、非技术团队

企业统一类：Microsoft Agent Framework、Google ADK

优势：云平台深度集成、多语言支持、企业级安全
劣势：生态锁定风险、社区驱动创新不如独立框架快
适用：已在特定云平台上的企业

4.3 选型决策树

第一步：团队技术栈是什么？

纯 Python → 继续往下
NET/C# → Microsoft Agent Framework（唯一选择）
Java → Google ADK 或 AgentScope（Java 版）
TypeScript → OpenAI Agents SDK（JS/TS 版）或 LangGraph.js
多语言混合 → Google ADK（覆盖 Python/TS/Java/Go）

第二步：核心使用场景？

数据密集型 RAG / 文档问答 → LlamaIndex
角色化多 Agent 协作 → CrewAI
复杂有状态工作流 → LangGraph
快速原型 / MVP → CrewAI 或 OpenAI Agents SDK
企业低代码 AI 平台 → Dify
国内企业私有化 → AgentScope 或 Dify

第三步：部署要求？

Azure 云 → Microsoft Agent Framework
Google Cloud → Google ADK
阿里云 → AgentScope
自托管/私有化 → Dify（最成熟）或 Agno
无特定偏好 → 根据场景选择

第四步：LLM 偏好？

OpenAI 生态 → OpenAI Agents SDK 或 LangGraph
Gemini 生态 → Google ADK
国内模型（通义、文心等） → AgentScope 或 Dify
模型无关 → PydanticAI（25+ 提供商）或 LangGraph

4.4 成本与商业模式对比

第五章：2026 年技术趋势与展望

5.1 MCP 标准化的影响

截至 2026 年 3 月，MCP 已被 10 个框架中的至少 8 个原生支持。MCP 正在成为 Agent 工具调用的"USB 接口"——框架之间的工具互操作壁垒正在消失。 这意味着选型时"工具生态丰富度"的权重下降，因为 MCP 工具可以在任何框架中使用。

5.2 A2A 协议进展

A2A 的普及速度不及 MCP。目前原生支持 A2A 的框架包括 Microsoft Agent Framework、Google ADK、AgentScope。CrewAI 和 LangGraph 通过社区插件提供部分支持。A2A 的真正价值在于跨组织的 Agent 互操作，但这需要更长的采纳周期。

5.3 框架融合趋势

Microsoft 合并 AutoGen + Semantic Kernel 是 2025-2026 年最重大的框架整合事件。这确立了一个趋势：未来框架数量会继续减少，存活者将更加强大。 LlamaIndex Workflows 独立成包也反映了"核心能力模块化、可独立复用"的趋势。

5.4 多模态 Agent 支持

OpenAI Agents SDK 的 Realtime Voice Agent 支持、Google ADK 的双向流式音视频、Agno 的多模态输入——语音和视觉正在成为 Agent 的标配能力，而不再是附加功能。

5.5 国内生态的差距与优势

5.6 未来格局预测

可能成为事实标准的：LangGraph（复杂工作流领域）、PydanticAI（类型安全 Agent 基础设施层）

快速增长的：CrewAI（多 Agent 协作）、Agno（全栈 Agent 平台）

整合期过后有望爆发的：Microsoft Agent Framework（企业级 Agent 的最终归宿）

可能被边缘化的：独立的 AutoGen（已进入维护模式）、不持续投入的小众框架

稳健但定位收窄的：LlamaIndex（继续深耕数据密集型场景）、Google ADK（Google Cloud 生态内）、Dify（低代码平台细分市场领导者）

第六章：总结与选型建议

6.1 综合排名（按工程实用性）

LangGraph — 生产 Agent 系统的金标准。学习成本高但回报最大，适合需要长期维护的关键系统。
CrewAI — 多 Agent 协作的最佳入口。上手极快，角色化设计直观，但底层控制力有限。
LlamaIndex — 数据密集型 Agent 的不二之选。RAG 能力无人能及，Workflows 1.0 扩展了通用性。
PydanticAI — 类型安全 Agent 的未来。轻量、可测试、无依赖。特别适合作为大型系统的构建块。
Dify — 低代码 Agent 平台的标杆。131k Stars 证明了市场需求，私有化部署成熟。
Agno — 全栈 Agent 开发的最佳体验。从原型到 API 的闭环最完整。
Microsoft Agent Framework — .NET 企业的唯一选择。合并带来了强大的综合能力，但 GA 待发布。
OpenAI Agents SDK — 最低门槛的 Agent 框架。语音 Agent 支持是独特亮点。
Google ADK — Google Cloud 企业的最佳选择。多语言支持独树一帜。
AgentScope — 国内企业和学术研究的优秀选择。透明可控理念先进，国际化是短板。

6.2 场景化推荐清单

6.3 给不同角色的建议

给独立开发者 / 技术探索者

从 PydanticAI 或 OpenAI Agents SDK 开始——它们的学习曲线最平缓，能让你快速理解 Agent 开发的核心概念。当你需要更复杂的编排时，再学习 LangGraph。不要一上来就选最复杂的框架。

给初创公司技术团队

如果你的产品核心是 AI Agent，选择 LangGraph 作为底层编排引擎，搭配 PydanticAI 的类型安全工具。如果需要快速验证想法，先用 CrewAI 做原型，验证后再迁移到 LangGraph。Agno 的全栈方案也值得考虑——从原型到部署一站式解决。

给大型企业技术委员会

首先明确你的云战略：Azure 企业选 Microsoft Agent Framework，Google Cloud 选 Google ADK，多云/混合云选 LangGraph + Dify 组合。低代码需求用 Dify 赋能业务团队，复杂系统用 LangGraph 保障工程质量。优先考虑 MCP 和 A2A 协议支持，确保未来的互操作能力。评估框架不仅看技术能力，也要看商业模式——开源协议、商业授权、长期维护承诺都是关键决策因素。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-03-20，如有侵权请联系 cloudcommunity@tencent.com 删除

框架