
学 Agent 开发,很多人的路径是这样的。
找一套教程,跟着敲,Demo 跑起来了,然后遇到真实项目,就不知道该怎么办了。
出了问题,不知道该查哪里。是模型不行?是代码写错了?还是哪里没配好?
我今天想分享的,是 Anthropic 工程团队自己踩过的坑。
他们做 Claude、做企业 Agent 项目,把遇到的问题、得出的结论,写成文章公开出来了。
我挑了 5 篇,里面有几个结论,第一次看到的时候我觉得挺反直觉的。
01 他们发现,很多客户根本不需要做 Agent
文章标题: Building Effective Agents
原文链接:
https://www.anthropic.com/engineering/building-effective-agents
Anthropic 跟几十个不同行业的团队合作后发现一件有点反直觉的事:做得好的系统,往往用的是简单、可组合的模式,而不是复杂框架。
他们甚至直接建议,能用固定流程解决,就别急着把决定权全交给 Agent。
这句话从一家做 AI 的公司嘴里说出来,值得停一下想想。
02 同一个模型,提示词不同,结果能差十万八千里
文章标题: Claude Prompt Engineering Overview
原文链接:
https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/overview
拿客服分类来说,只告诉 AI“把问题分类”,和把分类标准、边界情况、什么时候转人工都说清楚,跑出来的效果可能完全不一样。
模型没有变,差的是任务有没有说清楚。
这套文档讲的不是某句万能咒语,而是怎么定义成功、测试结果,再一点点把 Prompt 改好。
03 Agent 越跑越笨,原因可能不是模型
文章标题: Effective Context Engineering for AI Agents
原文链接:
https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents
长任务做着做着,Agent 可能开始忘事、重复调用工具,连已经确认过的结论都找不到。
Anthropic 把一个重要原因叫作“context rot”:信息越来越多,模型反而更难抓住真正重要的东西。
这篇最值得看的,就是他们怎么决定哪些信息该留下,哪些应该压缩或者临时再找。
04 一个搜索问题,最后靠改工具描述解决了
文章标题: Writing Effective Tools for Agents — with Agents
原文链接:
https://www.anthropic.com/engineering/writing-tools-for-agents
Anthropic 上线 Claude 的网页搜索工具时,发现它总会在搜索词后面擅自加上“2025”,把结果越搜越偏。
最后他们没有换模型,而是改进了工具描述,把 Claude 引回了正确方向。
Agent 用不好工具,不一定是它不会,也可能是工具根本没让它看懂。
05 他们做了一个协议,后来把它捐了出去
文章标题: Introducing the Model Context Protocol (MCP)
原文链接:
https://www.anthropic.com/news/model-context-protocol
2024 年底,Anthropic 开源了 MCP,想解决 AI 每接一个文档库、数据库和业务系统,都要重新适配的问题。
后来 OpenAI、Google 等公司也开始支持 MCP。2025 年底,Anthropic 又把它捐给 Linux 基金会旗下的 Agentic AI Foundation,交给行业共同建设。
它已经不只是 Claude 自己的连接方案了。
06 最后
这 5 篇有个共同点:结论都没有在鼓吹 Agent 多厉害,反而一直在给它加限制、划边界。
很多任务不需要 Agent,信息不是越多越好,效果差也不一定要换模型。
如果只是想涨涨见识,挑一篇最感兴趣的开始就行。如果正在做 Agent 项目,里面大概率有你正在头疼的问题。
觉得有意思,可以转给也在关注 AI 的朋友。