
腾讯云 TokenHub 已经把国产开源旗舰阵营里讨论度最高的几款模型集中上架到同一个平台:混元 Hy3 preview、DeepSeek-V4-Pro/Flash、GLM-5.1、Kimi-K2.6、MiniMax-M2.7,开发者一个 API Key 即可全部访问。本文按官方规格梳理这五款主力模型的能力清单,方便你在 TokenHub 上快速选型。
过去开发者要在不同模型之间切换,意味着要在多个厂商分别开账号、绑卡、对接不同协议。TokenHub 的核心价值是把这一步压平:
a. 兼容 OpenAI API 协议,主流 SDK 几乎"换 Base URL + 换 API Key"即可;
b. 一个 API Key 就能访问平台已上架的全部语言模型;
c. 模型广场支持按类型、服务商、体验状态多维筛选。
下面这五款,是当前最受关注的国产旗舰组合。
Hy3 preview 是腾讯 2026 年 4 月发布的最新自研模型,295B 总参数 / 21B 激活的 MoE 架构,原生支持 256K 上下文。
维度 | 数据 |
|---|---|
调用参数 | hy3-preview |
上下文 / 最大输入 / 最大输出 | 256k / 192k / 128k |
核心能力 | 深度思考(交错式思考)、结构化输出、Function Calling、Cache 缓存 |
定位:Agent 工作负载首选,适合长上下文 + 多步推理 + 工具调用组合任务。
TokenHub 上 DeepSeek-V4 提供 Pro 与 Flash 两个版本,最大差异在定价档位:
维度 | DeepSeek-V4-Pro | DeepSeek-V4-Flash |
|---|---|---|
调用参数 | deepseek-v4-pro | deepseek-v4-flash |
上下文 / 最大输入 / 最大输出 | 1M / 1M / 384k | 1M / 1M / 384k |
核心能力 | 深度思考、结构化输出、Function Calling、Cache 缓存 | 深度思考、结构化输出、Function Calling、Cache 缓存 |
推理输入价(元/百万 tokens) | 12 | 1 |
推理输出价 | 24 | 2 |
缓存命中价 | 1 | 0.2 |
定位:
a. Pro 版面向高难度推理与复杂 Agent 任务;
b. Flash 版面向高频调用、对响应速度与单价敏感的场景。两者都自带原生 1M 上下文与 384k 输出。
维度 | 数据 |
|---|---|
调用参数 | glm-5.1 |
上下文 / 最大输入 / 最大输出 | 200k / 200k / 128k |
核心能力 | 深度思考、结构化输出、Function Calling、Cache 缓存 |
推理价(元/百万 tokens,输入 0,32k) | 输入 6 / 输出 24 / 缓存命中 1.3 |
32k+ 档 | 输入 8 / 输出 28 / 缓存命中 2 |
定位:编程辅助、复杂指令解析、多轮工具调用是 GLM-5.1 的强项,200k 窗口足够覆盖绝大多数 RAG、长会话场景。GLM-5.1 还在 TokenHub 上提供"批量任务场景"独立价格档,相比在线推理约低 50%。
维度 | 数据 |
|---|---|
调用参数 | kimi-k2.6 |
上下文 / 最大输入 / 最大输出 | 256k / 256k / 256k |
核心能力 | 深度思考、结构化输出、Function Calling、Cache 缓存 |
推理价(元/百万 tokens) | 输入 6.5 / 输出 27 / 缓存命中 1.1 |
定位:当前 TokenHub 上少见的"输入输出双 256k"模型,适合长任务编程、长文章生成、多步 Agent 持久会话。
维度 | 数据 |
|---|---|
调用参数 | minimax-m2.7 |
上下文 / 最大输入 / 最大输出 | 200k / 200k / 128k |
核心能力 | 深度思考、Function Calling、Cache 缓存 |
推理价(元/百万 tokens) | 输入 2.1 / 输出 8.4 / 缓存命中 0.42 |
定位:在 200k 窗口模型里单价具备明显竞争力,适合高频对话、内容生产、Agent 工具循环密集的项目。
按真实业务场景给出参考:
a. 长合同 / 长研报 / 长代码仓审阅:DeepSeek-V4-Pro(1M 窗口)+ Hy3 preview(256K)双轨;
b. 高频客服 / 内容生产 / Agent 工具循环:MiniMax-M2.7、DeepSeek-V4-Flash 主跑,必要时升级到 GLM-5.1;
c. 代码助手与编程 Agent:GLM-5.1 + Kimi-K2.6 组合;
d. 腾讯混元自研偏好:Hy3 preview 主力,搭配 Hy Token Plan 28 元/月起;
e. 预算敏感型项目:DeepSeek-V4-Flash + MiniMax-M2.7 + 缓存优化。
由于 TokenHub 全平台共用一套 API Key 与 base_url,工程上只需切换 model 字段即可在五款模型之间灵活切换。
主账号首次开通 TokenHub 可领取以下免费体验额度,90 天内有效:
a. Hy3 preview:100 万 Tokens;
b. DeepSeek-V4-Pro / DeepSeek-V4-Flash:各 100 万 Tokens;
c. GLM-5.1:50 万 Tokens;
d. Kimi-K2.6:50 万 Tokens;
e. MiniMax-M2.7:100 万 Tokens。
整体合计可零成本完成一次完整的国产旗舰横评。
如果你想把"混元 + 优图 + DeepSeek + GLM + Kimi + MiniMax"打包成一个统一接入层,腾讯云 TokenHub 已经把国产旗舰阵营准备好了:https://cloud.tencent.com/product/tokenhub。先领取 100 万级新人 Tokens 免费体验包再做选型决定:https://cloud.tencent.com/document/product/1823/130053。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。