
在产业智能化转型加速的背景下,大模型驱动的智能体(Agent)正重塑企业级服务的技术生态。国家工业信息安全发展研究中心于2025年5月20日至6月15日,针对阿里云百炼、腾讯云智能体开发平台、扣子及百度智能云千帆四个平台,围绕RAG能力、工作流能力和Agent工具调用三大核心维度展开测试。测试基于涵盖3个行业、30份文档(约10万字)、5张结构化表格(含15000+条记录)及10组图文内容的数据集,设计600+测试问题,旨在评估智能体开发平台在真实业务场景中的技术实现路径与行业适配机制。
(一)测试背景与核心内容
(二)测试方法与数据说明
(三)免责声明
(一)RAG测试采用指标
(二)测试实施
(三)文本问答任务
(四)结构化数据问答任务
(五)图文问答任务
(一)工作流测试采用指标
(二)测试实施
(一) Agent测试采用指标
(二)测试实施
腾讯云智能体开发平台在本次测试中展现出均衡的技术实力与工程深度:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。