10 个月前,Devin 团队说过"别建多 Agent"。
现在他们彻底变了。
真正能落地的多 Agent 模式:一个人写,一群人想。一个 Devin 写代码,另一个 Devin 专门审代码。
他们的多 Agent 经验是:可以并行思考,但只能串行写入。并行的部分可以负责检索、审查、规划、路由,这些都是"情报工作"。写入的部分必须唯一。
其中还有个宝贵的经验:针对上下文腐烂的上下文隔离处理。
这是分工协作模式的转变。Devin 的多Agent经验

多Agent分工
为什么上下文会"腐烂"?
(不是上下文超长)
当一个 AI Agent 持续处理同一代码库时,它的上下文窗口会逐渐被以下内容填满:

上下文腐烂的后果:

上下文腐烂
根据 Devin 团队公布的实验数据:
核心发现:写代码的 Agent 脑子里塞满了仓库细节,它会越写越糊涂;而审代码的 Agent 拿白纸从头看 diff,反而比写代码的聪明 10 倍。
这个发现颠覆了共享上下文能提高协作效率的直觉。
上下文隔离不是牺牲协作质量,而是保护审查者的"白纸视角"。

白纸审查
上下文隔离方案Anthropic的Claude Code也有类似的处理:subagent(子 Agent)
子 Agent 获得隔离上下文,父 Agent 只转发任务描述,结果以单条消息形式返回。这避免了每轮转录重放问题。

核心原则:
Devin 的Manager 模式
Devin 团队已上线 Manager Devin,实现了真正的"一写一审"分工:
这种模式的价值:可以审计每次决策,可以追踪每个 Agent 的贡献,可以独立评估每个环节的质量。

子Agent隔离
基于 400+ AI Agent 项目的经验,有开发者总结了生产级 AI Agent 的上下文设计 Checklist:
ps:这些经验在设计Agent的时候,可以作为Prompt检查下。
短期趋势(1-3 个月)
上下文工程工具将进入爆发期:
代码审查将从人工转向 AI 多 Agent 协作。
中期趋势(6-12 个月)
一写一审模式将演进为更复杂的分工体系:专门的前期研究 Agent、专门的设计 Agent、专门的实现 Agent、专门的测试 Agent、专门的审查 Agent。
大型企业将采用专用的 Agent 协调平台。
[1] Muhammad Haseeb — Context Engineering for Multi-Agent LLM Code Assistants
[2] @jtregunna Twitter — 上下文架构深度解析
[3] @championswimmer Twitter — pi-context-prune 工具
[4] @MaryamMiradi Twitter — 400+ AI Agent 生产经验总结