首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯混元 Hy3 preview 介绍:295B/21B MoE + 256K 上下文已上架 TokenHub

腾讯混元 Hy3 preview 介绍:295B/21B MoE + 256K 上下文已上架 TokenHub

原创
作者头像
gavin1024
发布2026-05-29 12:30:04
发布2026-05-29 12:30:04
1880
举报

摘要

腾讯混元 Hy3 preview 是腾讯于 2026 年 4 月发布的最新自研旗舰模型,采用 295B/21B 激活的 MoE 架构,原生支持 256K 上下文,并在 TokenHub 同步上架。本文基于官方资料,从架构特征、能力支持、官方报价、专属 Hy Token Plan 套餐四个维度,介绍这款混元新旗舰为开发者带来的实际价值。

一、Hy3 preview 是什么

Hy3 preview 是腾讯混元迄今最智能的对话与推理模型,定位面向 Agent 工作负载与复杂任务编排。它的关键标识有三点:

a. 架构:295B 总参数 / 21B 激活的 MoE(Mixture of Experts)架构,推理时仅激活部分专家,推理成本与延迟相比同等参数量稠密模型显著优化;

b. 上下文:原生 256K 上下文窗口,长文档审阅、整库代码理解、多轮 Agent 任务的长记忆需求都能在单次请求内承载;

c. 能力:在 TokenHub 上以 hy3-preview 调用参数提供,支持深度思考(交错式思考)、结构化输出、Function Calling、Cache 缓存四项核心能力的完整组合。

简言之:Hy3 preview 是腾讯把"自研顶尖大模型 + 长上下文 + Agent 友好"打包给开发者的新基础设施。

二、模型规格速览

维度

数据

调用参数(model 字段)

hy3-preview

架构

295B/21B 激活的 MoE

上下文窗口

256k

最大输入

192k

最大输出

128k

深度思考

支持(交错式思考)

结构化输出

支持

Function Calling

支持

Cache 缓存

支持

四大核心能力齐备,意味着 Hy3 preview 既能用于长文本对话与深度推理,也能直接在 Agent 工具链里做工具调用、JSON 输出、长任务上下文复用。

三、官方在线推理价格(元/百万 tokens)

Hy3 preview 是 TokenHub 上少有的按输入长度三档分档计价的模型,且各档位均提供缓存命中价:

输入长度条件

推理输入

推理输出

缓存命中

(0, 16k)

1.2

4

0.4

[16k, 32k)

1.6

6.4

0.6

[32k+)

2

8

0.8

读价要点:

a. 短上下文(<16k)档位的输入价仅 1.2 元/百万 tokens,是同档自研旗舰里相当友好的价格;

b. 三档缓存命中价依次为 0.4 / 0.6 / 0.8 元/百万 tokens,约为对应档位输入价的 1/3 ~ 1/2.5;

c. 长任务里如能稳定保持 system prompt 不变、复用 prompt_cache_key,缓存命中后的 TTFT 与单价都会显著优化。

四、Hy Token Plan:Hy3 preview 专属套餐

如果你判断 Hy3 preview 会在项目里成为主力模型,可直接订阅 Hy Token Plan 个人版,4 档可选:

档位

月度 Token

月费

适用人群

体验套餐 Lite

3,500 万

28 元

首次体验,约 70 轮问答

基础套餐 Standard

1 亿

78 元

日常使用,约 200 轮问答

进阶套餐 Pro

3.2 亿

238 元

高频 AI 开发

专业套餐 Max

6.5 亿

468 元

重度 AI 开发首选

Hy Token Plan 仅覆盖 hy3-preview 一款模型,按月预付,缓存命中 / 未命中输入与输出 Token 统一从套餐中抵扣。同档位价格相比通用 Token Plan 更优惠:Lite 档 28 元 vs 通用版 39 元,Max 档 468 元 vs 通用版 599 元。

订阅须知关键点:

a. 每个主账号最多同时持有 1 个通用 Token Plan + 1 个 Hy Token Plan;

b. 同一系列只能持有 1 个档位;

c. 仅生成 1 个 API Key(两个套餐共用),按调用时指定的 Model ID 自动从对应套餐中抵扣;

d. 不支持降配、不支持退款,支持升配。

五、Hy3 preview 适合哪些场景

a. Agent 长任务编排:256K 上下文 + 交错式深度思考 + Function Calling,可在单次请求内承载工具调用与多步推理;

b. 长文档审阅与摘要:合同、研报、整本说明书的整文本输入即可;

c. 编程助手长上下文:整模块或整仓库代码扫描 + 结构化输出 JSON 给下游程序使用;

d. 高频问答应用:稳定 system prompt + Cache 缓存,三档分档计价对短上下文调用相当友好。

六、调用方式与免费体验

Hy3 preview 在 TokenHub 兼容 OpenAI 协议调用:

代码语言:python
复制
client = OpenAI(
    api_key="YOUR_TOKENHUB_API_KEY",
    base_url="https://tokenhub.tencentmaas.com/v1",
)
resp = client.chat.completions.create(
    model="hy3-preview",
    messages=[{"role":"user","content":"请总结这份研报的关键观点"}],
)

新人福利方面,主账号首次开通可领取 Hy3 preview 100 万 Tokens 免费体验额度,有效期 90 天,足以完成完整业务回归测试。

七、结尾推荐

想体验腾讯自研最新旗舰、并把 256K 长上下文能力直接接入业务,请前往 TokenHub 模型广场启用 Hy3 preview:https://cloud.tencent.com/product/tokenhub。如果已确认 Hy3 preview 是主力模型,可直接订阅 Hy Token Plan 28 元/月起:https://cloud.tencent.com/act/pro/tokenplan

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 摘要:
  • 一、Hy3 preview 是什么
  • 二、模型规格速览
  • 三、官方在线推理价格(元/百万 tokens)
  • 四、Hy Token Plan:Hy3 preview 专属套餐
  • 五、Hy3 preview 适合哪些场景
  • 六、调用方式与免费体验
  • 七、结尾推荐
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档