文章/答案/技术大牛

发布

GLM-5.2 技术解读：智谱百万上下文的新一代旗舰模型

文章来源：企鹅号 - wisemodel开源社区

始智AI wisemodel将打造一个“All for Agent”的原生技术平台，始终坚持“中立、开放、共建、共创、合作”五项基本原则，欢迎加入共同成长。

GLM-5.2 是智谱AI（Zhipu AI）推出的最新旗舰大模型，专为长程任务（long-horizon tasks）设计。相较于上一代 GLM-5.1，GLM-5.2 在长程任务能力上有显著提升，并首次在 100万 token（1M context）的超长上下文上实现了稳定可靠的表现。

四大核心能力升级：

1. 稳定的百万级上下文

长上下文的真正挑战不在于"能接受多少 token"，而在于在超长、混乱的 Agent 轨迹中保持质量稳定。1M context 容易声称，但真正在工程压力下稳定可靠才是难题。

为此，GLM-5.2 大幅扩展了面向Agent 场景的百万 token 训练数据，覆盖：

大规模代码实现

自动化研究

性能优化

复杂调试

使得模型不仅"窗口宽"，而且"执行稳"，成为可持续工程工作的实用基础。

三项长程任务基准测试表现：

在三项长程基准测试中，GLM-5.2 均为开源模型第一名，验证了其 1M 上下文已转化为真正的长程任务交付能力。

2. 标准编程基准测试

GLM-5.2 在标准编程基准上为最强开源模型，相比 GLM-5.1 大幅提升

Terminal-Bench 2.1 仅落后 Claude Opus 4.8 数个百分点，超越 Gemini 3.1 Pro

3. 灵活推理投入度（Effort Level）控制

GLM-5.2 引入多档推理投入度控制，让用户可以在模型能力与任务执行速度/计算成本之间自由选择：

在相同 token 消耗下，GLM-5.2 的 Agent 编程性能远强于 GLM-5.1，能力定位约在 Claude Opus 4.7 与 Opus 4.8 之间

Max 档位：在极具挑战的任务上，可分配更多计算资源，进一步提升编程能力

设计哲学：给予用户更大灵活性，让不同场景都能找到最适合的推理模式

4. 百万上下文架构：IndexShare

4.1 为什么需要 IndexShare？

在 1M 上下文长度下，DSA（动态稀疏注意力）的 indexer 计算成本显著增加。为了解决这个问题，GLM-5.2 应用了 IndexShare 技术：

核心做法：每4 个 Transformer 层共享一个轻量级 indexer。

- 该 indexer 放置在 4 层中的第一层

- 其 top-K 索引在后续 3 层中被复用

- 3/4 层的 indexer 点积和 top-K 操作被完全省去

效果：在 1M 上下文长度下，每个 token 的 FLOPs降低 2.9 倍。GLM-5.2 从 128K 序列长度开始基于 IndexShare 训练，在更少计算量下超越了 GLM-5.1 的长上下文表现。

4.2 MTP 层与 KV 优化

GLM-5.2 对 MTP（Multi-Token Prediction）层做了两项改进，以服务于投机解码（speculative decoding）：

目标一：最小化 MTP 作为 Draft 模型的开销同样应用 IndexShare

目标二：最大化投机解码接受率消除 GLM-5.1 MTP 层中的训练-推理不一致性

以两步 MTP 推理为例：

第一步：与训练一致，所有隐状态来自目标模型

第二步：h₁:₄来自目标模型，h₅来自 MTP 层 KV 缓存是混合状态，造成不一致

IndexShare 解决了这个问题：通过在 MTP 各步复用 top-K 索引，保持推理时 KV 缓存的一致性，MTP 接受长度提升最高达 20%。

5. 完全开源

GLM-5.2 采用MIT 开源协议：

无区域限制

技术获取无国界壁垒

可自由商用、修改和分发

总结

GLM-5.2 是智谱在长程 Agent 能力上的一次重大突破：

百万上下文

真正从"能接受"变成"用得住"，大幅扩展了编程 Agent 的任务边界

IndexShare 架构

将 1M 上下文的计算成本降低近 3 倍，实用性大幅提升

多档 Effort Level

让用户按需平衡性能与成本，适配从快速验证到深度研究的多样场景

MIT 开源

让全球开发者无障碍获取和使用

GLM-5.2 目前是开源编程模型的新标杆，在长程任务上与闭源顶级模型（Opus 4.8、GPT-5.5）的差距已大幅缩小。

发表于: 2026-06-172026-06-17 19:34:39
原文链接：https://page.om.qq.com/page/OXGJcR-LZhXwJvK0ui0PE8BA0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

GLM-5.2 技术解读：智谱百万上下文的新一代旗舰模型

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐