小米发布了万亿参数大模型Mimo-V2-Pro。
小米大模型团队的负责人是95后的罗福莉。
罗福莉曾经就职于阿里达摩院和Deepseek。
在x上,罗福莉也发表了自己的最新观点。

其中最引起我兴趣的是文中关于“复杂代理式脚手架的核心是-编排上下文”的观点。

这一观点和我自己做Agent的体验不谋而合。
我们开发一个Agent,其实有超过80%的时间是围绕于编排展开的。
大模型是基础,包括R1、COT和长上下文窗口,这是所有基于模型上层应用范式的基础。
在模型上层有两个分支,一边是Chatbot,主要解决自然语言方式和人对话,理解意图。
另一边是Agent,即可以自己做事了。
一个Agent基本上由两部分组成:SOTA模型+软件工程。
大部分公司没有能力,也没有必要自己预训练出一个模型,用开源的或者闭源的模型API即可,所有Agent的开发大量工作集中于软件工程层面。
那开发Agent的软件工程和传统软件工程最不一样的点是什么呢?
就是编排本身。
虽然Agent需要记忆和工具,但无非是对传统软件工程的延伸,比如你可以把你的网关用mcp协议封装一个,就变成了所谓的Agent的工具了,这里和传统软件工程没啥不一样。
真正不一样的点,在于如何为Agent上下文编排这些工具或者记忆。
在Chatbot分支,编排的是上下文,因为Chatbot的主要形式是只读的,通过function call调用工具,或者通过RAG获取知识,都是为了丰富上下文,回复用户问题。
而Agent要想干活,不能只读,还得写入,所有编排这件事情,在Agent分支下更加重要。
所以Agent的核心是上下文工程,上下文工程的核心手段是编排上下文。
那编排什么呢?
是站在Agent的视角下,编排你的工作流、你的工具、你的知识、你的流程、你的策略、你的认知、你对于模型在该场景的信任度,这些编排在一起,形成了一个Agent独有的世界观,这样才可以让Agent在这套世界观下更好的工作。