很多人做AI Agent,整天盯着怎么调优提示词、换最新大模型,这其实走偏了。一位开发者硬啃几个月,从零写了一个Agent运行底座,得出一个极具颠覆性的结论:大模型只占Agent工程的20%,剩下的80%全是套在模型外面的控制底座(Harness)。
这个逻辑很简单:模型是一个极不稳定的生成器。真正决定Agent能不能在现实里干脏活、累活的,是它外面的软件控制系统。比如:上下文快撑爆了怎么自动压缩?工具调用出错时,怎么给模型提供精准的纠错指引,而不是让它原地打转傻等?
别把Agent当成会思考的“数字生命”,它就是一个普通的软件运行环境,只是把LLM当作一个不稳定的API来调用。决定Agent商业价值的,不是模型有多聪明,而是你的控制底座有多皮实。模型负责提供可能性,底座负责把可能性变成确定性。
x.com/ByteMohit/status/2063493300884246598