

2023年,ChatGPT横空出世,大模型成了所有人嘴里的词。2024年,各路应用层产品密集落地。2025年,DeepSeek让中国团队证明了低成本高性能的可能。到了2026年,一个现实的问题摆在每个从业者面前:大模型浪潮还没消退,下一波已经开始拍岸——你准备好了吗?
很多人误以为“大模型时代”已经过去,其实不是。大模型本身仍在高速演进,只是它的角色正在从“主角”变成“基础设施”。
就像当年的云计算一样——2010年代初,云是热词;2020年代,没人再讨论云本身,但所有系统都跑在云上。大模型也在走同一条路:它从被讨论的对象,变成了支撑一切的底层能力。
这个变化对实际工作意味着什么?意味着未来你构建的每一个产品、每一条业务流程,都默认有“语言理解与生成”这个能力在里面,就像默认有网络连接一样。
如果大模型解决了“理解和表达”,那下一步就是“行动”。
这就是 AI Agent(智能体) 正在做的事。
Agent 和聊天机器人的本质区别在于:它不只是回答你的问题,它会自主规划步骤、调用工具、执行任务、处理异常。你对它说“帮我整理这周所有客户反馈邮件,按问题类型分类,生成一份摘要报告,发给产品团队”——它直接给你做,而不是给你一段“你可以这样做”的建议文字。
这个变化已经有现实数据支撑:
根据 CB Insights 2025 年的调研,82% 的受访企业计划在 12 个月内将 AI Agent 用于客户支持场景。在企业财报电话会议上,“AI Agent” 的提及频率比 2023 年增长了整整 10 倍。OpenAI 在 2025 年 1 月正式推出 Operator,可以独立完成订机票、填写表单、在线购物等复杂任务——这不是演示,是正式上线的产品。
对于普通技术从业者来说,Agent 意味着一件事:你的工作流程可能比你想象的更快被重组。不是被替代,而是:你写的代码会变少,但你需要设计的“任务编排逻辑”会变多。
如果说 Agent 是在数字世界里“能干活”,那具身智能(Embodied AI)就是把这个能力搬到了物理世界。
简单说:给机器人装上大模型的“大脑”,让它能看、能听、能理解环境、能动手。
这不是科幻。2025年,全球人形机器人出货量约 1.33 万台,同比增长超过 465%。中国厂商在这场竞赛中跑得极快:智元机器人(AGIBOT)以 5168 台出货量占据全球 39% 市场份额,宇树科技(Unitree)以 4200 台紧随其后,两家合计拿下全球 71% 的份额。相比之下,特斯拉、Figure AI 等海外明星企业的 2025 年出货量仍在 150 台左右,尚处于小规模试点阶段。
特斯拉 Optimus V3 计划于 2026 年中启动大规模量产,2025 年的整机单价已从数十万元降至十万元甚至万元以内。IDC 预测 2026 年全球人形机器人出货量将突破 5 万台。
在技术层面,驱动这波进展的核心是 VLA 架构(视觉-语言-行动)——机器人不再靠工程师一条条手写控制逻辑,而是用一个通用模型解决多种任务。RT-2X、π0/π0.5、Gemini Robotics 等模型已经验证了“一个模型控制所有机器人”的可行性。
2026 年政府工作报告明确将具身智能列入未来产业,与量子科技、脑机接口并列。这意味着政策端的资源会持续跟进。
过去十年,软件吃掉世界。接下来十年,软件开始吃掉硬件。
这里有一个很重要的时间节点逻辑:
大模型解决了“感知和推理”,让机器第一次有了接近人类的语言和视觉理解能力;具身智能把这个能力装进了有手有脚的机体,让它能在物理世界里执行任务。两者叠加,才构成完整的“物理世界 AI”。
以前做机器人,最难的是让它“理解”任务——工程师要写几千行规则来告诉它“如果遇到 A 情况,做 B 动作”。大模型出现之后,这个问题从根本上被绕过了:机器人可以“理解”自然语言指令,可以泛化到没见过的场景。
这是一个范式层面的转变,不是量变,是质变。
很多从业者的惯性思维是“等这个技术成熟了,我再去学”。但这波技术的特点是:你学的过程,就是它成熟的过程。
几个具体的行动方向,供参考:
如果你是软件工程师: Agent 编排能力会成为新的核心技能。学 MCP(Model Context Protocol)、学如何设计多 Agent 协作流程、学如何做 Agent 测试与监控,比单纯研究大模型本身更有直接价值。
如果你是产品经理:开始问自己:当前产品里,有哪些“用户需要多步操作完成”的流程,可以被 Agent 压缩成一步?Agent 不是功能,是交互范式的重构。
如果你是测试工程师: Agent 系统的测试比传统软件难得多——输入不确定、执行路径不固定、结果难以标准化。这是新的挑战,也是新的专业壁垒。
如果你在硬件/制造相关行业:具身智能不是机器人公司的事,是所有需要用手工劳动完成重复性工作的行业的事。物流、装配、检测、农业——这些场景都在进入视野。
热潮里有泡沫,这是规律。
人形机器人目前的大多数订单,仍以“验证性采购”为主,而非基于生产力需求的扩张性采购。Agent 系统在复杂、开放环境下的可靠性,仍然是个工程难题。具身智能从实验室走向车间,还有很多摔跤、卡顿、误操作的问题没有彻底解决。
但这不是“不投入”的理由,而是“怎么投入”的参考。聚焦在能产生真实价值的落地场景,而不是追概念、追估值,才是务实的姿势。
大模型是一扇门,开了之后,里面是一栋楼。
AI Agent 是这栋楼的第二层,具身智能是第三层,更远处还有量子计算、脑机接口、世界模型……楼还在建,但电梯已经开始运行。
对于大多数人来说,现在最重要的不是判断“哪个技术会赢”,而是搞清楚自己在哪个位置,下一步往哪走。技术浪潮不等人,但它也不会只属于那些押注对了赛道的人——它属于那些持续在水里游的人。