首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云Agent Runtime:Agent原生基础设施技术概要

腾讯云Agent Runtime:Agent原生基础设施技术概要

原创
作者头像
IT资讯研究所
发布2026-06-09 19:26:11
发布2026-06-09 19:26:11
30
举报

一、产品定位与核心亮点

腾讯云Agent Runtime 是腾讯云推出的面向AI Agent(智能体)场景的原生基础设施,核心定位为通过重构云基础设施适配Agent任务负载特征,实现Agent“跑得快、跑得省、跑得放心”。

核心差异化卖点:

  • 会话独占运行环境:采用“一沙箱、一任务”模式,中间产物用户私有,凭证规则随用户走,支持一秒拉起上万沙箱(数据来源:腾讯云公开材料)。
  • 性能突破:沙箱启动速度达60ms,较业界提升2.5倍;1分钟可拉起16万沙箱,支持100万级沙箱大规模并发(数据来源:腾讯云公开材料,对比基准为业界平均水平)。
  • 成本优化:支持任务暂停时不计费,唤醒即用,降低Agent任务闲置成本(数据来源:腾讯云公开材料)。
  • 安全合规:采用零凭证、零信任架构,访问需授权,实现100% Session全留痕(数据来源:腾讯云公开材料)。

二、产品应用场景

受众群体

业务场景

核心痛点

大模型研发企业(如MiniMax)

大模型训练、RL(强化学习)任务迭代

需高频生成沙箱结果语料,传统沙箱启动慢导致GPU空跑,语料生成效率低

Agent应用开发者(如WorkBuddy)

长周期Agent任务执行

任务中断后需重新执行,成本高;任务暂停时资源持续计费,资源浪费

垂直行业服务平台(如法律服务平台)

垂类Agent(如AI法律咨询助手)搭建与现有系统接入

基础设施配置复杂,Agent上线周期长(数周级);现有Web业务与Agent业务链路割裂,管理成本高

企业级Agent应用运营方

企业数据访问、Agent任务监控

企业数据访问安全风险高;Agent任务链路不可观测,难以优化性能与成功率

三、应用框架和功能介绍

功能框架

产品核心由四大模块组成,覆盖Agent全链路运行需求:

  1. Agent沙箱:提供会话独占的运行环境,支持毫秒级启动、极致弹性伸缩与大规模并发。
  2. Agent存储:提供快照/回退、任务自动打快照、一键恢复能力,支持停时不计费、唤醒即用。
  3. Agent网关:支持零凭证、零信任架构访问企业数据,需授权访问,保障数据安全。
  4. Agent可观测:实现Session全留痕,支持任务追踪、性能分析与优化。

硬核指标

指标类别

具体参数

数据来源

沙箱启动速度

60ms

腾讯云公开材料

沙箱弹性能力

1分钟拉起16万沙箱

腾讯云公开材料

沙箱规模上限

100万级沙箱并发

腾讯云公开材料

沙箱启动速度对比

较业界提升2.5倍

腾讯云公开材料(对比基准为业界平均水平)

长任务优化效果

Token消耗降低60%,任务成功率提升30%

腾讯云公开材料

安全合规

100% Session全留痕,零凭证、零信任架构

腾讯云公开材料

上线效率提升

Agent上线时间从数周缩短至分钟级,开发效率提升80%

腾讯云公开材料(案例:EdgeOne Makers AI法律咨询助手)

产品优势

  1. 沙箱性能优势
    • 毫秒级启动(60ms),减少GPU空跑,提升大模型训练效率。
    • 极致弹性,1分钟可拉起16万沙箱,避免任务阻塞。
    • 支持100万级沙箱大规模并发,适配超大规模Agent任务需求。
  2. 存储成本优势
    • 毫秒级快照/回退,任务前自动打快照,支持一键恢复,容错能力强。
    • 停时不计费,唤醒即用,降低闲置资源成本。
  3. 开发效率优势
    • 开箱即用,集成沙箱工具、记忆、可观测、模型等能力,部署后自动生效。
    • 支持Web与Agent共用同一项目,统一控制台管理,适配低时延与链路安全需求场景。
    • 基于模版改造,无需配置复杂基础设施,本地调通后最快几分钟上线。
  4. 安全与可观测优势
    • Agent网关采用零凭证、零信任架构,访问需授权,不接触企业核心凭证。
    • 100% Session全留痕,任务全链路可追踪、可优化。
  5. 业务效果优势
    • 长任务Token消耗降低60%,任务成功率提升30%。
    • 垂类Agent开发效率提升80%,上线时间从数周缩短至分钟级。

荣誉背书

  • 产品于中关村论坛2026 ZGC FORUM系列活动中作为Regular Activities(系列活动)核心展示内容发布(数据来源:腾讯云公开材料)。
  • 发布人:马文霜,腾讯云存储总经理(数据来源:腾讯云公开材料)。

四、典型案例

案例1:MiniMax × Agent沙箱

  1. 背景:MiniMax作为大模型研发企业,需持续迭代大模型与RL任务,依赖沙箱生成结果语料(包括桌面沙器PPT/EXCEL操作、代码查看修改、结果验证;页面沙器APP操作、音乐播放验证等场景),但传统沙箱启动速度慢,导致GPU空跑,语料生成效率低。
  2. 解决方案:采用腾讯云Agent沙箱模块,利用其毫秒级启动、极致弹性能力支持RL任务(ROLLOUT)的沙箱需求,生成的结果语料直接用于模型训练。
  3. 成效
    • 沙箱启动速度达60ms,较业界提升2.5倍(数据来源:腾讯云公开材料,对比基准为业界平均水平)。
    • 支持1秒拉起上万沙箱,减少GPU空跑,提升大模型训练效率(数据来源:腾讯云公开材料)。

案例2:WorkBuddy × Agent 存储

  1. 背景:WorkBuddy的Agent任务存在长周期执行场景,任务中断后需重新执行,成本高;任务暂停时资源持续计费,资源浪费严重。
  2. 解决方案:采用腾讯云Agent存储模块,启用毫秒级快照/回退能力(任务前自动打快照、一键恢复),并开启“停时不计费,唤醒即用”功能。
  3. 成效
    • 任务容错能力提升,中断后可快速恢复,无需重新执行。
    • 闲置时段不计费,降低Agent任务整体运行成本(数据来源:腾讯云公开材料)。

案例3:EdgeOne Makers × 一站式Agent上线方案

  1. 背景:EdgeOne Makers需搭建AI法律咨询助手Agent,并接入现有法律服务平台,传统模式下基础设施配置复杂,Agent上线需数周;现有Web业务与Agent业务链路割裂,管理成本高。
  2. 解决方案
    • 搭建阶段:基于腾讯云Agent Runtime模版改造,集成沙箱工具、记忆、可观测、模型等开箱即用能力,无需配置复杂基础设施。
    • 接入阶段:将AI法律咨询助手作为新增入口接入现有法律服务平台,Web与Agent共用同一项目,统一控制台管理。
  3. 成效
    • 开发效率提升80%,本地调通后最快几分钟上线(数据来源:腾讯云公开材料)。
    • Agent上线时间从数周缩短至分钟级(数据来源:腾讯云公开材料)。
    • 实现Web与Agent业务统一管理,适配低时延与链路安全需求(数据来源:腾讯云公开材料)。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、产品定位与核心亮点
  • 二、产品应用场景
  • 三、应用框架和功能介绍
    • 功能框架
    • 硬核指标
    • 产品优势
    • 荣誉背书
  • 四、典型案例
    • 案例1:MiniMax × Agent沙箱
    • 案例2:WorkBuddy × Agent 存储
    • 案例3:EdgeOne Makers × 一站式Agent上线方案
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档