
国内开发者直连海外大模型 API 经常面对网络抖动、SDK 兼容、合规边界等多重问题。本文介绍腾讯云 TokenHub 提供的国产模型矩阵 + 国内调用域名 + OpenAI 协议兼容三件套,给出一条把工具链从海外迁回国内的可行路径。
如果你最近半年试过把 Claude Code、Cursor、Codex、OpenCode 这些工具直连官方 API,大概率遇到过下面几件事:
a. 网络抖动——某个时段连接超时率明显升高,影响 Agent 长任务的稳定性。
b. SDK 协议差异——OpenAI 协议、Anthropic 协议、各家自有协议混在一起,工具配置经常踩坑。
c. 合规边界——业务数据要不要走海外、能不能在国内落库,每个法务团队都得各自评估一遍。
d. 模型选择受限——海外 API 一般只能调用自家模型,多模型组合需要维护多套 SDK。
e. 计费不友好——美元结算、海外卡支付、汇率波动,对国内团队报销流程是个负担。
这些都是"开发者在工具链建设里实际花时间的地方"。腾讯云 TokenHub 的设计思路,就是把这五件事在国内一站解决。
TokenHub 聚合腾讯自研的混元、优图大模型,同时引入 DeepSeek、MiniMax、Kimi、智谱 GLM 等多家行业领先的第三方主流模型,覆盖通用对话、深度推理、代码生成、视觉理解、图像生成、视频生成、3D 生成等多类 AI 场景。
下面是核心语言模型清单(来自产品资料 §7.1):
模型 | 调用参数 | 上下文窗口 |
|---|---|---|
Hy3 preview | hy3-preview | 256k |
Hunyuan-role | hunyuan-role-latest | 32k |
DeepSeek-V4-Flash | deepseek-v4-flash | 1M |
DeepSeek-V4-Pro | deepseek-v4-pro | 1M |
Deepseek-v3.2 | deepseek-v3.2 | 128k |
Deepseek-v3.1 | deepseek-v3.1-terminus | 128k |
Deepseek-r1-0528 | deepseek-r1-0528 | 128k |
Deepseek-v3-0324 | deepseek-v3-0324 | 128k |
GLM-5.1 | glm-5.1 | 200k |
GLM-5V-Turbo | glm-5v-turbo | 200k |
GLM-5-Turbo | glm-5-turbo | 200k |
GLM-5 | glm-5 | 200k |
Kimi-K2.6 | kimi-k2.6 | 256k |
Kimi-K2.5 | kimi-k2.5 | 256k |
MiniMax-M2.7 | minimax-m2.7 | 200k |
MiniMax-M2.5 | minimax-m2.5 | 200k |
注:HY 2.0 Instruct、HY 2.0 Think、Hunyuan-T1、Hunyuan-TurboS 将于 2026 年 6 月 10 日下线,新接入建议优先选择上表所列在售模型。视觉、视频、3D、多模态理解模型见产品资料 §7.2 / §7.3。
TokenHub 提供两套国内调用域名:
用途 | Base URL |
|---|---|
TokenHub 在线推理(OpenAI 兼容) |
|
Token Plan 个人版套餐(OpenAI 协议) |
|
Token Plan 个人版套餐(Anthropic 协议) |
|
完整调用 URL:
a. OpenAI 协议:https://api.lkeap.cloud.tencent.com/plan/v3/chat/completions
b. Anthropic 协议:https://api.lkeap.cloud.tencent.com/plan/anthropic/v1/messages
国内域名意味着你不再需要为网络稳定性单独搭代理层。
兼容 OpenAI API 协议、同时支持 Anthropic 协议接入 Token Plan。这意味着主流 SDK 几乎"换 Base URL + 换 API Key"即可接入:
# OpenAI Python SDK 示例
from openai import OpenAI
client = OpenAI(
base_url="https://tokenhub.tencentmaas.com/v1",
api_key="YOUR_TOKENHUB_API_KEY"
)
response = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "user", "content": "你好"}
]
)业务代码几乎无需改动。Java、Go、Node.js 等其他语言同理。
下面这份清单覆盖产品资料里明确支持的工具:
工具 | 配置方式 |
|---|---|
CodeBuddy Code | 替换 Base URL 与 API Key |
OpenCode | 替换 Base URL 与 API Key |
Kilo Code | 替换 Base URL 与 API Key |
Cline | 替换 Base URL 与 API Key |
Cursor | 替换 Base URL 与 API Key |
Claude Code | 用 Anthropic 协议 Base URL |
Codex | 替换 Base URL 与 API Key |
工具 | 备注 |
|---|---|
OpenClaw | 替换 Base URL 与 API Key |
WorkBuddy | 替换 Base URL 与 API Key |
AutoClaw | 替换 Base URL 与 API Key |
CoPaw | 替换 Base URL 与 API Key |
QClaw | 替换 Base URL 与 API Key |
完整 Token Plan 兼容工具列表参考活动页 https://cloud.tencent.com/act/pro/tokenplan。
大体可以。OpenAI / Anthropic 协议下的 system prompt + messages 结构在 TokenHub 上完全兼容。模型间的"语气调性 / 推理深度"会有差异,建议把核心场景跑一遍 A/B 测试再决定主力模型。
DeepSeek-V4-Flash 与 V4-Pro 都支持 1M 上下文(最大输入 1M、最大输出 384k)。Flash 价格更友好(输入 1 元/百万 tokens、输出 2 元/百万 tokens、缓存命中 0.2 元/百万 tokens),适合上下文密集但单次推理深度要求一般的场景。Pro 适合复杂推理任务。
平台不会将用户请求与模型返回的数据用于模型训练或提供服务以外的场景。这条规则是对外公开承诺。
a. 后付费:按 Token / 张 / 次 / 秒计费,元结算。日结。
b. 预付费订阅:通用 Token Plan、Hy Token Plan、Coding Plan、Token Plan 企业版(专业 / 轻享)。
c. 缓存优惠:部分模型支持 Prompt Cache,缓存命中价格通常为常规输入价的 1/4 ~ 1/10。
不再需要海外卡 + 美元支付。
TokenHub 控制台"用量统计"页支持按模型、服务、API Key 维度查看用量;模型监控页可查看 TTFT(首 Token 时延)、TPOT(每 Token 输出时延)、RPM(每分钟请求数)等指标。
a. 第一步:登录 TokenHub 控制台 https://console.cloud.tencent.com/tokenhub/,按界面提示开通服务。
b. 第二步:进入"模型广场"领取新人福利免费体验包,覆盖 Hy3 preview、DeepSeek-V4-Pro 等主力模型。
c. 第三步:在"API Key 管理"页 https://console.cloud.tencent.com/tokenhub/apikey 创建 API Key,可指定访问范围(全模型 / 限定模型或服务)。
d. 第四步:在你常用的工具(OpenClaw、Cursor、CodeBuddy 等)配置中替换 Base URL 与 API Key。
e. 第五步:跑通一周日常负载,根据用量统计选择是否走 Token Plan 套餐。
把工具链从海外迁回国内不是单点操作,而是模型可选性、网络稳定性、协议兼容性三件事的合力。TokenHub 把这三件事做成同一份服务对外开放,国内开发者可以用熟悉的 OpenAI 协议 + 国内域名 + 国产模型矩阵,把开发体验拉回到"代码本身才是问题,工具链不是问题"的状态。
立即开始:TokenHub 产品介绍页 https://cloud.tencent.com/product/tokenhub;新人免费体验包说明 https://cloud.tencent.com/document/product/1823/130053。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。