把 GLM-5.2 接进 Claude Code，满血版配置就这几步

洞见AI世界

发布于 2026-07-01 20:35:22

1770

最近随着 fable 被封，以及 GLM-5.2 的出圈，感觉大家已经对国产 AI 更加自信了

最夸张的是连 a16z 创始人马克·安德森（Marc Andreessen）都下场，说很多业内人觉得它是第一个能正面刚美国大厂、还没什么明显短板的中国开源模型。那条推近万赞。Vercel 的 CEO 也发推，说被它的编程能力震到了，说这事改变了一些东西。

配图

热度不是凭空来的。智谱六月把权重按 MIT 协议开了出来，谁都能下、谁都能本地跑。更关键的是时间点，从 Opus 4.5 发布到 GLM-5.2，开源追平闭源大概用了 204 天，差不多六个半月。这速度，是 DeepSeek R1 之后我见过社区最兴奋的一次，很多人直接把它叫做又一个 R1 时刻。

而且这波热度背后还有一层更微妙的东西。因为前不久，美国政府一纸出口管制，把 Claude 的 Fable 5 和 Mythos 5 给禁了，连 Anthropic 自己的海外员工都用不了。OpenAI 新出的 GPT-5.6，据报道也只先放给二十来家可信伙伴。一边是闭源前沿在一扇扇关门，一边是中国开源把满血权重直接甩到 HuggingFace 上随便下。这个反差，才是 GLM-5.2 真正点着的那根引线。

说实话，用过 fable 5 的我是真觉得模型很强大，真的好用，但是好用你却用不上也不行啊，还是当初 A 社吹 Mythos 吹太猛了，结果让美国政府直接下场禁了，只能说做人还是不能太嚣张 🐶

说回GLM-5.2 ，不仅价格实惠而且不用担心哪天被卡脖子用不了，确实是一个完美替代品，唯一的痛点就是算力不够，plan 都售罄了！！

但热闹归热闹，有几件事得先泼点冷水

我自己拿真实项目喂了它一阵，也扒了一圈别人的反馈。有三件事得先摊开说，免得你冲进去发现跟想的不一样。

第一，能力别神化。有个天天拿它当主力的老哥说得挺直白，GLM-5.2 还没摸到 Opus 4.8 和 GPT-5.5 那条线，大概在 Opus 4.7 往下一点。真要抠数字，SWE-bench Pro 上它是 62.1，Claude Fable 5 是 80.3，差着十八分呢。所以别拿它当 Opus 的无缝平替，不然期望要落空了

GLM-5.2 在 DeepSWE 上的成本与分数表现

第二，便宜这事也在悄悄缩水。智谱自家的 coding 订阅这半年从三美金一路涨到十八美金的 lite、七十二美金的 pro，还叠了倍率和周配额。当初冲着便宜来的那批人，不少已经转头去用别家按 token 计费的了。

第三，小红书上有个说法特别逗，叫趁没降智赶紧用。意思是这类模型刚发布那阵状态最猛，过阵子体感会回落。真假难讲，但你能明显感觉到，大家对它是又爱又有点不放心。

讲这些真不是劝退。恰恰相反，正因为它能打、又便宜，才值得你亲手接上去跑两天，拿自己的活去验它到底够不够格。

下面是我自己跑通的接法，照着来，五分钟搞定。

准备：三样东西

一个智谱开放平台账号，一个 API Key，本机装好的 Claude Code。

顺带说下怎么选。只是想尝个鲜，别急着掏钱，智谱时不时给新号送免费 token，把整套流程跑通、试个十几二十轮绰绰有余。真打算拿它当日常主力，那就直接开 GLM Coding Plan 的包月，按量走心里没底。先白嫖跑通，手感对了再上包月，这个顺序最稳。

第一步，拿 Key

去智谱开放平台注册账号，开通 GLM Coding Plan，进控制台找到你的 API Key，复制好备用。

https://www.bigmodel.cn/glm-coding?ic=NJHXJZEPPI

配图

提醒两点。这个 Key 等于你的钱包，别贴到公开仓库、别发群里，泄露了赶紧去后台吊销重建。另外控制台里能看到额度和用量，配置完之后回来盯一眼，心里有数。

第二步，配置 Claude Code

这是最关键、也最容易卡住的一步。

智谱有一份官方接入文档（ https://docs.bigmodel.cn/cn/coding-plan/tool/claude ），把步骤写得很全。最省事的办法是直接跑它的一键脚本，自动帮你装好 Claude Code、配好环境变量。

npx @z_ai/coding-helper

懒得手动配的，跑完这条基本就能用。下面是手动版，想搞清楚每一步在干嘛的看这个。

Claude Code 认下面这几个环境变量，照着填，地址就是官方那个，所有人都一样，不用改。

export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic
export ANTHROPIC_AUTH_TOKEN=你刚才复制的 API Key
export ANTHROPIC_DEFAULT_OPUS_MODEL=glm-5.2
export ANTHROPIC_DEFAULT_SONNET_MODEL=glm-5.2

顺手解释一下，省得配错了都不知道哪错了。第一行告诉 Claude Code 别再把请求发去 Anthropic 官方，改发到智谱这个地址。第二行是你的身份凭证，让智谱认得你、好计费。后面两行是满血的关键，把 Claude Code 里 Opus 和 Sonnet 两个档位都指到 glm-5.2，这样你不管切哪个模式，跑的都是满血 GLM-5.2，不会被偷偷降级到小模型。

把这几行粘到终端回车，当前这个窗口就生效了。想确认有没有生效，敲一句 echo $ANTHROPIC_BASE_URL，能打印出地址就对了。

如果你想每次开终端都自动生效，就把这几行写进 ~/.zshrc（用 bash 的写 ~/.bashrc），存好之后 source ~/.zshrc 刷新一下。Windows 用户改用户目录下的 .claude\settings.json，在 env 块里填上面同样这几个值，效果一样。

配图

第三步，启动验证

直接敲 claude 进去。

随便丢个小任务给它，或者用 /status 看一眼，确认现在走的是 GLM-5.2，不是 Opus。还有个土办法，让它干点活，留意一下回话的风格和语气，跟你平时用的 Opus 不太一样，那就对了。

想切回 Opus 也简单，把那几个环境变量 unset 掉，或者干脆新开一个没配置过的终端窗口。两套环境随时切，互不打架。

几个大概率会遇到的坑

照上面走，大概率顺。但有几个高频坑先给你打个预防针，省得到时候抓瞎。

连不上、报 401，十有八九是 Key 或地址没真正生效。先 echo 一下那几个变量确认有没有值，再回控制台核对 Key 有没有复制全、有没有过期。

账单比你想的高。这是 Claude Code 配 GLM 最反直觉的一个点，有人实测缓存命中只有百分之八左右，因为 Claude Code 对非自家模型的缓存优化很弱，重度用下来甚至可能比直接开 Opus 还贵。轻度用没啥感觉，重度用就得盯着账单了，真想把成本摁到底，可能得换个壳子，这事另一篇专门聊。

会话突然卡死。如果你让它处理带图片的任务，某些第三方接入下会把会话搞挂，遇到了别慌，/clear 清掉上下文重开就行。

速度时快时慢。专用基建上 GLM-5.2 能跑到每秒八九十 token，飞快。但你要是走高峰期的订阅档位，可能会明显变慢，这跟模型本身没关系，纯粹是排队。

嫌麻烦的，还有两条更省事的路

实在不想折腾账号和环境变量，也有开箱即用的路子。

国内可以用 Zcode，免费跑满血 GLM-5.2，装好直接在里面选模型，适合只想快速试手感、不爱碰命令行的人。海外的话，Cursor 已经和 Fireworks 合作把 GLM-5.2 内置了，更到最新版在模型列表里直接挑，还自带零数据留存，对在意隐私的团队挺友好。这两条都不用自己配 base_url。

挑哪条，看你有多重度。偶尔玩玩，Zcode 或 Cursor 就够；天天靠它吃饭、想把成本和数据都攥在自己手里，那还是老老实实走第二步自己配。