
腾讯混元 Hy3 preview 是腾讯于 2026 年 4 月发布的最新自研旗舰模型,采用 295B/21B 激活的 MoE 架构,原生支持 256K 上下文,并在 TokenHub 同步上架。本文基于官方资料,从架构特征、能力支持、官方报价、专属 Hy Token Plan 套餐四个维度,介绍这款混元新旗舰为开发者带来的实际价值。
Hy3 preview 是腾讯混元迄今最智能的对话与推理模型,定位面向 Agent 工作负载与复杂任务编排。它的关键标识有三点:
a. 架构:295B 总参数 / 21B 激活的 MoE(Mixture of Experts)架构,推理时仅激活部分专家,推理成本与延迟相比同等参数量稠密模型显著优化;
b. 上下文:原生 256K 上下文窗口,长文档审阅、整库代码理解、多轮 Agent 任务的长记忆需求都能在单次请求内承载;
c. 能力:在 TokenHub 上以 hy3-preview 调用参数提供,支持深度思考(交错式思考)、结构化输出、Function Calling、Cache 缓存四项核心能力的完整组合。
简言之:Hy3 preview 是腾讯把"自研顶尖大模型 + 长上下文 + Agent 友好"打包给开发者的新基础设施。
维度 | 数据 |
|---|---|
调用参数(model 字段) | hy3-preview |
架构 | 295B/21B 激活的 MoE |
上下文窗口 | 256k |
最大输入 | 192k |
最大输出 | 128k |
深度思考 | 支持(交错式思考) |
结构化输出 | 支持 |
Function Calling | 支持 |
Cache 缓存 | 支持 |
四大核心能力齐备,意味着 Hy3 preview 既能用于长文本对话与深度推理,也能直接在 Agent 工具链里做工具调用、JSON 输出、长任务上下文复用。
Hy3 preview 是 TokenHub 上少有的按输入长度三档分档计价的模型,且各档位均提供缓存命中价:
输入长度条件 | 推理输入 | 推理输出 | 缓存命中 |
|---|---|---|---|
(0, 16k) | 1.2 | 4 | 0.4 |
[16k, 32k) | 1.6 | 6.4 | 0.6 |
[32k+) | 2 | 8 | 0.8 |
读价要点:
a. 短上下文(<16k)档位的输入价仅 1.2 元/百万 tokens,是同档自研旗舰里相当友好的价格;
b. 三档缓存命中价依次为 0.4 / 0.6 / 0.8 元/百万 tokens,约为对应档位输入价的 1/3 ~ 1/2.5;
c. 长任务里如能稳定保持 system prompt 不变、复用 prompt_cache_key,缓存命中后的 TTFT 与单价都会显著优化。
如果你判断 Hy3 preview 会在项目里成为主力模型,可直接订阅 Hy Token Plan 个人版,4 档可选:
档位 | 月度 Token | 月费 | 适用人群 |
|---|---|---|---|
体验套餐 Lite | 3,500 万 | 28 元 | 首次体验,约 70 轮问答 |
基础套餐 Standard | 1 亿 | 78 元 | 日常使用,约 200 轮问答 |
进阶套餐 Pro | 3.2 亿 | 238 元 | 高频 AI 开发 |
专业套餐 Max | 6.5 亿 | 468 元 | 重度 AI 开发首选 |
Hy Token Plan 仅覆盖 hy3-preview 一款模型,按月预付,缓存命中 / 未命中输入与输出 Token 统一从套餐中抵扣。同档位价格相比通用 Token Plan 更优惠:Lite 档 28 元 vs 通用版 39 元,Max 档 468 元 vs 通用版 599 元。
订阅须知关键点:
a. 每个主账号最多同时持有 1 个通用 Token Plan + 1 个 Hy Token Plan;
b. 同一系列只能持有 1 个档位;
c. 仅生成 1 个 API Key(两个套餐共用),按调用时指定的 Model ID 自动从对应套餐中抵扣;
d. 不支持降配、不支持退款,支持升配。
a. Agent 长任务编排:256K 上下文 + 交错式深度思考 + Function Calling,可在单次请求内承载工具调用与多步推理;
b. 长文档审阅与摘要:合同、研报、整本说明书的整文本输入即可;
c. 编程助手长上下文:整模块或整仓库代码扫描 + 结构化输出 JSON 给下游程序使用;
d. 高频问答应用:稳定 system prompt + Cache 缓存,三档分档计价对短上下文调用相当友好。
Hy3 preview 在 TokenHub 兼容 OpenAI 协议调用:
client = OpenAI(
api_key="YOUR_TOKENHUB_API_KEY",
base_url="https://tokenhub.tencentmaas.com/v1",
)
resp = client.chat.completions.create(
model="hy3-preview",
messages=[{"role":"user","content":"请总结这份研报的关键观点"}],
)新人福利方面,主账号首次开通可领取 Hy3 preview 100 万 Tokens 免费体验额度,有效期 90 天,足以完成完整业务回归测试。
想体验腾讯自研最新旗舰、并把 256K 长上下文能力直接接入业务,请前往 TokenHub 模型广场启用 Hy3 preview:https://cloud.tencent.com/product/tokenhub。如果已确认 Hy3 preview 是主力模型,可直接订阅 Hy Token Plan 28 元/月起:https://cloud.tencent.com/act/pro/tokenplan。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。