大家好,我是苏三。
3月27日,智谱在用户社群里直接丢下一颗“深夜炸弹”:Coding Plan 全体用户即刻升级到最新旗舰 GLM-5.1。
没有推文,没有长篇 benchmark,也没有营销预热,直接让你用。

重点不是“发了个新版本”。
重点是这波动作很干脆:没有长篇跑分海报,没有 benchmark 对比图,直接上线给所有人用。
一句话概括:GLM-5.1已经全量可用,且这次是拿真实体验说话。
很多人会把它当成一次普通版本升级,但我觉得不是。
如果一家公司对模型效果没有把握,通常会先做很多外围包装:参数解释、榜单截图、分数强调。
而这次智谱的做法是:不铺垫,直接放给用户跑真实任务。
这个动作像谁?
很像当初 DeepSeek 的节奏:不搞过度营销,直接让工程师上手,用结果说话。
这背后其实是一个信号:
说明智谱对GLM-5.1这个版本非常自信。
这两天,我到智谱的官网:https://bigmodel.cn/glm-coding

订阅了一个月的Coding Plan。

为了避免“短问题看不出差异”,我专门选了两类高消耗任务:
订阅了智谱的Coding Plan之后,访问官方文档:https://docs.bigmodel.cn/cn/coding-plan/using5-1
可以看到接入GLM-5.1的文档:

打开~/.claude/settings.json文件:

使用 GLM-5.1,需要在配置文件 settings.json 中,添加或替换如下环境变量参数:
{
"env": {
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "GLM-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "GLM-5.1",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "GLM-5.1"
}
}
启动一个命令行窗口,运行 claude 启动 Claude Code,可以看到GLM-5.1模型:

在 Claude Code 中输入 /status 命令,也可以确认模型状态:

任务目标:
ApiResponse<T>;SQL 必须参数化;接口错误码统一;输出可本地运行。我给模型的原始指令(可直接复用):
你现在是项目主程,请按“可交付”标准完成任务,不要只给建议。
目标:实现专业的订单管理系统 MVP。
技术栈:Spring Boot 3 + PostgreSQL + Redis + React + Vite + TS。
硬性约束:
1) Controller 统一返回 ApiResponse<T>
2) 数据访问必须参数化,禁止拼接 SQL
3) 先给任务分解和目录结构,再逐步实现
4) 每一步输出“变更文件清单”
5) 如果出错,先定位原因并修复,再继续
6) 最终输出本地运行步骤和验证用例
我实际观察到的完整步骤:





后面会有一些确认,选第1项或者第2项就行。

最后会生成一个项目的完整本地运行部署,我们按照这个部署可以启动项目。

如果在启动项目时,遇到了一些报错,可以直接让GLM-5.1帮我们解决:

后端项目代码结构:

前端项目代码结构:

运行效果如下:



查询数据库,能够查到这两条数据:

视频效果如下:
说明从0~1开始,一个完整的前端和后端的订单功能已经开发好了。
一句话结论:在复杂任务的持续执行和完整交付上,GLM-5.1体感已经和上一代拉开明显差距。
不是更会“答题”,而是更会“做事”。

真正拉开差距的点,不是“单次回答更漂亮”,而是下面这三项:
这三个能力叠在一起,才会出现“断档领先”的体感。
很多人问:是不是能平替 Opus 4.6?

我的看法很直接:在“长任务持续执行 + 中途自修 + 最终完整交付”这三个核心维度上,GLM-5.1已经出现了明显的同档体验。
当然,不同任务类型会有波动,这很正常。
但如果你看的是“真实工程效率”和“月度成本”,这波升级已经足够值得你马上去试。
如果你是智谱的 Coding Plan 用户,我建议你不要先看别人评价。
直接做这 5 步:
你会很快知道它到底值不值“开源第一”这四个字。
现在最值得警惕的不是“AI会不会替代你”,而是你还在把AI当搜索框在用。
当模型已经能像资深工程师一样做长程任务时,你的核心价值会越来越集中在这些能力上:
换句话说,未来不是“会不会写代码”的竞争,而是“谁更会用AI完成复杂交付”的竞争。
建议大家可以自己亲自体验一下GLM-5.1,越早加入,越容易拿到这波效率红利。
智谱这次GLM-5.1的更新,最让我有感的一点是:智谱没有用“解释”证明自己,而是用“可用”证明自己。
如果你这周只做一件和 AI 相关的事,我建议就是: 打开 Coding Plan,给 GLM-5.1一个真正的长任务,让它从目标跑到交付。
你会更直观地理解,为什么大家都在说:开源第一模型,真的换人了。