
最近随着 fable 被封,以及 GLM-5.2 的出圈,感觉大家已经对国产 AI 更加自信了
最夸张的是连 a16z 创始人马克·安德森(Marc Andreessen)都下场,说很多业内人觉得它是第一个能正面刚美国大厂、还没什么明显短板的中国开源模型。那条推近万赞。Vercel 的 CEO 也发推,说被它的编程能力震到了,说这事改变了一些东西。

配图
热度不是凭空来的。智谱六月把权重按 MIT 协议开了出来,谁都能下、谁都能本地跑。更关键的是时间点,从 Opus 4.5 发布到 GLM-5.2,开源追平闭源大概用了 204 天,差不多六个半月。这速度,是 DeepSeek R1 之后我见过社区最兴奋的一次,很多人直接把它叫做又一个 R1 时刻。
而且这波热度背后还有一层更微妙的东西。因为前不久,美国政府一纸出口管制,把 Claude 的 Fable 5 和 Mythos 5 给禁了,连 Anthropic 自己的海外员工都用不了。OpenAI 新出的 GPT-5.6,据报道也只先放给二十来家可信伙伴。一边是闭源前沿在一扇扇关门,一边是中国开源把满血权重直接甩到 HuggingFace 上随便下。这个反差,才是 GLM-5.2 真正点着的那根引线。
说实话,用过 fable 5 的我是真觉得模型很强大,真的好用,但是好用你却用不上也不行啊,还是当初 A 社吹 Mythos 吹太猛了,结果让美国政府直接下场禁了,只能说做人还是不能太嚣张 🐶
说回GLM-5.2 ,不仅价格实惠而且不用担心哪天被卡脖子用不了,确实是一个完美替代品,唯一的痛点就是算力不够,plan 都售罄了!!
我自己拿真实项目喂了它一阵,也扒了一圈别人的反馈。有三件事得先摊开说,免得你冲进去发现跟想的不一样。
第一,能力别神化。有个天天拿它当主力的老哥说得挺直白,GLM-5.2 还没摸到 Opus 4.8 和 GPT-5.5 那条线,大概在 Opus 4.7 往下一点。真要抠数字,SWE-bench Pro 上它是 62.1,Claude Fable 5 是 80.3,差着十八分呢。所以别拿它当 Opus 的无缝平替,不然期望要落空了

GLM-5.2 在 DeepSWE 上的成本与分数表现
第二,便宜这事也在悄悄缩水。智谱自家的 coding 订阅这半年从三美金一路涨到十八美金的 lite、七十二美金的 pro,还叠了倍率和周配额。当初冲着便宜来的那批人,不少已经转头去用别家按 token 计费的了。
第三,小红书上有个说法特别逗,叫趁没降智赶紧用。意思是这类模型刚发布那阵状态最猛,过阵子体感会回落。真假难讲,但你能明显感觉到,大家对它是又爱又有点不放心。
讲这些真不是劝退。恰恰相反,正因为它能打、又便宜,才值得你亲手接上去跑两天,拿自己的活去验它到底够不够格。
下面是我自己跑通的接法,照着来,五分钟搞定。
一个智谱开放平台账号,一个 API Key,本机装好的 Claude Code。
顺带说下怎么选。只是想尝个鲜,别急着掏钱,智谱时不时给新号送免费 token,把整套流程跑通、试个十几二十轮绰绰有余。真打算拿它当日常主力,那就直接开 GLM Coding Plan 的包月,按量走心里没底。先白嫖跑通,手感对了再上包月,这个顺序最稳。
去智谱开放平台注册账号,开通 GLM Coding Plan,进控制台找到你的 API Key,复制好备用。
https://www.bigmodel.cn/glm-coding?ic=NJHXJZEPPI

配图
提醒两点。这个 Key 等于你的钱包,别贴到公开仓库、别发群里,泄露了赶紧去后台吊销重建。另外控制台里能看到额度和用量,配置完之后回来盯一眼,心里有数。
这是最关键、也最容易卡住的一步。
智谱有一份官方接入文档( https://docs.bigmodel.cn/cn/coding-plan/tool/claude ),把步骤写得很全。最省事的办法是直接跑它的一键脚本,自动帮你装好 Claude Code、配好环境变量。
npx @z_ai/coding-helper懒得手动配的,跑完这条基本就能用。下面是手动版,想搞清楚每一步在干嘛的看这个。
Claude Code 认下面这几个环境变量,照着填,地址就是官方那个,所有人都一样,不用改。
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic
export ANTHROPIC_AUTH_TOKEN=你刚才复制的 API Key
export ANTHROPIC_DEFAULT_OPUS_MODEL=glm-5.2
export ANTHROPIC_DEFAULT_SONNET_MODEL=glm-5.2顺手解释一下,省得配错了都不知道哪错了。第一行告诉 Claude Code 别再把请求发去 Anthropic 官方,改发到智谱这个地址。第二行是你的身份凭证,让智谱认得你、好计费。后面两行是满血的关键,把 Claude Code 里 Opus 和 Sonnet 两个档位都指到 glm-5.2,这样你不管切哪个模式,跑的都是满血 GLM-5.2,不会被偷偷降级到小模型。
把这几行粘到终端回车,当前这个窗口就生效了。想确认有没有生效,敲一句 echo $ANTHROPIC_BASE_URL,能打印出地址就对了。
如果你想每次开终端都自动生效,就把这几行写进 ~/.zshrc(用 bash 的写 ~/.bashrc),存好之后 source ~/.zshrc 刷新一下。Windows 用户改用户目录下的 .claude\settings.json,在 env 块里填上面同样这几个值,效果一样。

配图
直接敲 claude 进去。
随便丢个小任务给它,或者用 /status 看一眼,确认现在走的是 GLM-5.2,不是 Opus。还有个土办法,让它干点活,留意一下回话的风格和语气,跟你平时用的 Opus 不太一样,那就对了。
想切回 Opus 也简单,把那几个环境变量 unset 掉,或者干脆新开一个没配置过的终端窗口。两套环境随时切,互不打架。
照上面走,大概率顺。但有几个高频坑先给你打个预防针,省得到时候抓瞎。
连不上、报 401,十有八九是 Key 或地址没真正生效。先 echo 一下那几个变量确认有没有值,再回控制台核对 Key 有没有复制全、有没有过期。
账单比你想的高。这是 Claude Code 配 GLM 最反直觉的一个点,有人实测缓存命中只有百分之八左右,因为 Claude Code 对非自家模型的缓存优化很弱,重度用下来甚至可能比直接开 Opus 还贵。轻度用没啥感觉,重度用就得盯着账单了,真想把成本摁到底,可能得换个壳子,这事另一篇专门聊。
会话突然卡死。如果你让它处理带图片的任务,某些第三方接入下会把会话搞挂,遇到了别慌,/clear 清掉上下文重开就行。
速度时快时慢。专用基建上 GLM-5.2 能跑到每秒八九十 token,飞快。但你要是走高峰期的订阅档位,可能会明显变慢,这跟模型本身没关系,纯粹是排队。
实在不想折腾账号和环境变量,也有开箱即用的路子。
国内可以用 Zcode,免费跑满血 GLM-5.2,装好直接在里面选模型,适合只想快速试手感、不爱碰命令行的人。海外的话,Cursor 已经和 Fireworks 合作把 GLM-5.2 内置了,更到最新版在模型列表里直接挑,还自带零数据留存,对在意隐私的团队挺友好。这两条都不用自己配 base_url。
挑哪条,看你有多重度。偶尔玩玩,Zcode 或 Cursor 就够;天天靠它吃饭、想把成本和数据都攥在自己手里,那还是老老实实走第二步自己配。
GLM-5.2 这波热度,说到底是开源第一次真的摸到了闭源前沿的门槛。再叠上闭源那头接连关门,这张牌对独立开发者的分量,比省那几个钱重得多。
但也别上头,它还没到能完全替代 Opus 的地步。好在接进 Claude Code 的门槛低到几乎可以忽略,五分钟的事。剩下的就交给你自己的真实项目,让它在你手里跑几天,能不能用,你比任何榜单都清楚。
工具一直在进化,用工具的人也得跟上。
我是洞见,下次见。