
腾讯云 TokenHub 的 API Key 管理支持精细化权限控制,可在创建时指定访问范围为全模型、限定特定模型或限定特定服务,并配合启停切换、调用统计、独立配额与 TPM 上限。本文系统梳理 API Key 管控的核心能力、常见使用场景与操作步骤,帮你在多业务、多团队场景下安全高效地分发模型调用权限。
很多团队接入大模型时是这样的节奏:先拿到一把 API Key 跑通 Demo,业务上线后不知不觉地把这把 Key 复制给前端、复制给脚本、复制给第三方插件,最后没人说得清究竟有多少地方在用它。直到某一天有人发现 Key 泄漏、调用量异常、成本翻倍,才意识到:"早知道一开始就分开管。"
API Key 是大模型调用的唯一凭据,它意味着调用权、计费权与限流配额。一旦失控,影响的不仅是预算,还有线上业务的稳定性。
腾讯云大模型服务平台 TokenHub 在 API Key 管理上做了三层精细化设计:访问范围、独立配额、调用统计。把这三层用好,多业务、多团队、多项目共享一个账号也能保持井然有序。
创建 API Key 时,平台允许选择三档访问范围:
范围类型 | 适用场景 |
|---|---|
全模型 | 个人开发或单一项目,希望一把 Key 通吃所有模型 |
限定特定模型 | 多模型矩阵,按业务线分配可调用的模型 |
限定特定服务 | 同一模型创建多个在线推理服务(不同限流 / 计费),按服务粒度授权 |
举个具体场景:内容审核业务只用 DeepSeek-V4-Flash,影像创意业务只用 HY-Image-V3.0 和 HY-Video-1.5,那就分别创建两把 Key、各自限定模型,既互不干扰,又方便按团队拉账。
在企业版专业套餐场景下,每把 API Key 还可以独立设置独占配额、配额上限和调用速率(TPM)。这意味着:
a. 预算保护:一把 Key 只能消耗它被分配的那部分积分,不会越界吃掉别的项目预算;
b. 速率隔离:核心生产业务设置较高 TPM、内部测试 Key 设置较低 TPM,新发版本不会冲击线上稳定性;
c. 可用模型清单:按业务线指定可用模型,防止误用高价模型导致成本失控。
每把 API Key 每日最多可修改 10 次配置,足以应对日常运营调整。每 1 万积分可创建 1 把 Key,企业版账号天然支持多 Key 分发。
控制台支持随时启用 / 停用某把 Key。某个测试 Key 调用量异常?一键停用,几秒内就阻断异常流量;问题修复后再启用,无需重新发卡。
"用量统计"页可按模型、服务、API Key 三个维度查看用量明细。月底拉账时,财务可以直接按 Key 维度分摊到对应业务部门,不必再手工拼凑日志。
互联网团队的常态:研发、运维、运营、数据各自有 AI 用例,但又共用一个主账号。这时候推荐:
a. 为每个团队各建一把 API Key,名称带上团队标识(例如 key-rd-prod、key-ops-test、key-data-batch);
b. 访问范围按需设定为"限定特定模型"或"限定特定服务";
c. 在企业版下,各 Key 设置独立的配额上限。
这样一来,"谁在调谁的模型,花了多少钱"一目了然。
同一个 GLM-5 模型,可能同时承担"内容生成"和"内容质检"两类业务。两类业务对限流容忍度不同,对计费精细度要求也不同。
操作思路:
a. 在"在线推理"中为同一模型创建两个服务(例如 service-content-gen、service-content-qc),分别设置限流;
b. 创建两把 API Key,访问范围设为"限定特定服务",分别只能访问对应的服务 ID;
c. 同一模型的多个服务计费完全独立,账单明细清晰可见。
需要把模型能力开放给外包供应商或合作伙伴,又不希望泄漏主 Key?方法很简单:
a. 创建一把限定特定模型的临时 Key;
b. 限定调用速率(如有企业版可设 TPM);
c. 项目结束时直接停用,不影响主业务的其他 Key。
新版本上线前,团队可以创建一把"灰度专用 Key",限定灰度服务,模拟少量真实流量预热 Prompt Cache。发版后再切回主 Key,正式承接生产流量,避免 KV Cache 冷启动导致首 Token 时延(TTFT)回升。
a. 在 API Key 列表点击对应 Key 的"编辑"按钮;
b. 调整可访问模型 / 服务清单;
c. 在企业版场景下还可调整独占配额、TPM 上限;
d. 保存即可生效。每把 Key 每日最多 10 次修改。
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer YOUR_API_KEY' \
-H 'X-Session-ID: session-abc123' \
-d '{"model": "deepseek-v4-flash", "messages": [...]}'a. 把 API Key 放在服务端环境变量或密钥管理服务里,不要硬编码到前端代码或开源仓库;
b. 调用时建议带上 X-Session-ID Header,把同一用户的多轮对话路由到同一推理实例,提升 Prompt Cache 命中率;
c. 配合 prompt_cache_key(建议取业务侧 conversation_id)使用,缓存命中价格通常为常规输入价的 1/4 ~ 1/10。
加固项 | 操作建议 |
|---|---|
Key 不进代码仓库 | 用环境变量 / 配置中心 / 密钥管理服务统一管理 |
最小权限原则 | 创建时只授权该业务需要的模型或服务 |
定期轮换 | 重要业务每季度轮换一次 Key |
异常告警 | 在控制台监控页对调用量异常、错误率异常配置告警 |
离职交接 | 员工调岗 / 离职时立即停用其名下 Key |
第三方临时 Key | 项目结束立即停用,不留后门 |
Q1:一个主账号最多可以创建多少把 API Key?
后付费场景下创建数量按账号资源策略;企业版专业套餐下,每 1 万积分可创建 1 把 Key,与套餐积分成正比。
Q2:删除 Key 后历史账单还在吗?
账单是按调用维度记录的,删除 Key 不影响历史账单查询,控制台"用量统计"和腾讯云费用中心仍可回溯。
Q3:限定特定模型的 Key 能调用其他模型吗?
不能。请求其他模型会被直接拒绝,不会产生计费。
Q4:Token Plan 个人版可以创建多个 Key 吗?
不可以。Token Plan 个人版仅支持生成 1 个 API Key,通用 Token Plan 与 Hy Token Plan 共用同一把 Key;企业版专业套餐则支持多 Key 分配。
Q5:API Key 泄漏怎么办?
立即在控制台停用该 Key 并新建 Key 替换,同时排查访问日志确认是否产生异常调用。
API Key 管理这件事,做对了几乎不可见,做错了就是事故。建议在团队内部把这几件事做成默认流程:业务上线先建 Key、按服务分授权、按团队拉账、定期复盘异常调用——半年下来运维同学会发现踩坑明显变少。
立即在 TokenHub 控制台 API Key 管理 完成第一把 Key 的精细化创建,新人开通还可领取最高 100 万免费 Tokens 用于回归测试。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。