首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >大模型重塑保险业务流:从底层算力基建到多智能体协同的工程化实践

大模型重塑保险业务流:从底层算力基建到多智能体协同的工程化实践

原创
作者头像
gawain2048
发布2026-05-28 17:08:46
发布2026-05-28 17:08:46
60
举报

分享人:李凯 | 腾讯金融云 副总经理

突破数据资产瓶颈与算力调度限制

在AI大模型技术加速向保险行业演进的进程中,企业普遍面临从“单点效率提升”向“系统性模式创新”跨越的战略困境。当前业务场景与技术架构的融合存在以下核心瓶颈:

  • 私域数据高价值密度与低质量的冲突: 尽管Scaling Law依然有效,但行业普遍缺乏高质量训练数据。企业沉淀的成千上万份文档、规章制度等核心资产缺乏向量化解析与全生命周期的数据治理,数据规模、多样性与时效性成为制约模型能力的瓶颈。
  • 应用场景停留在浅层交互: 现有应用多以对内提效的通用问答为主,未能深入核心业务流程(如核保核赔、智能风控)。从单一助理向多智能体(Multi-Agent)协同执行的“数字员工”范式革新迫在眉睫。
  • 指数级算力需求与异构资源纳管难题: 随着多模态交互和专属模型应用加速,算力需求呈指数级增长。混合云算力架构成为主流,但企业面临模型训练/推理的成本高昂、并发支持不足及底层异构算力(X86与ARM)难以兼容的工程挑战。

部署全栈AI原生体系:覆盖训练推理、工作流与私域知识库

为解决上述瓶颈,腾讯云提供从IaaS层、工具层到智能体开发的多层级大模型架构,支持DeepSeek系列与混元大模型双核驱动,提供以下核心技术解决方案:

  • 一站式AI训练推理工具链(TI-ONE): 支持从数据接入、模型训练到服务部署的全流程。平台内置异构算力兼容能力(X86与ARM服务器混合部署),并支持满血版DeepSeek-R1的精调和蒸馏及一键部署。通过本地专用集群一体化机柜降低算力投入资金压力。
  • 知识库与数据资产激活平台(腾讯乐享/腾讯ima): 提供在线协同文档统一目录管理、多级语义拆分与解析向量化服务。配合多重质量保障(巡检/审核)与权限管控,打破部门层级壁垒,实现企业级知识集成。
  • 多智能体开发与编排平台(Agent): 融合多Agent协同与灵活可控的工作流(Workflow)执行。内置RAG(检索增强生成)、自定义工作流模式,支持复杂文档版面分析与大模型OCR,实现从“问答”向“执行任务”的跨越。
  • 研发全链路智能辅助(AI代码助手): 以混元代码大模型为基座,覆盖代码补全、技术对话、单元测试、代码诊断等全流程,支持百种编程语言与主流IDE,云上云下均可交付。

核心业务指标量化:研发提效、算力优化与检索精度提升

基于大模型工具链在具体业务场景的规模化应用,核心投资回报率(ROI)与业务指标实现了以下量化突破

  • 关键指标一:软件工程研发效能大幅跃升 在研发团队全栈开发场景中,腾讯云AI代码助手(日活用户超3万)实现代码生成率达35%,帮助开发者人均编码时间缩短40%,同时提升代码质量,使人均千行Bug率降低31.5%
  • 关键指标二:推理算力成本优化与并发性能翻倍 TI-ONE平台依托自研Angel训推加速框架,实现超30%训练性能提升1-2倍推理加速比。在部署DeepSeek R1/V3开源方案时,QPS(每秒查询率)提升3倍单节点并发上限提升4倍,首字延时(TTFT)缩短1倍,同时大幅减少模型权重对显存的占用达1倍
  • 关键指标三:复杂文档端到端解析准确率领跑 在多模态与RAG应用端,通过业内首个长文本切分大模型对文本进行多级语义拆分,其支持复杂文档版面分析、元素排序的OCR大模型准确率提升30%

头部金融机构AI工程化落地矩阵

当前,该架构已深入上百个客户的应用场景,完成亿级行业数据针对性训练。以下为部分核心落地企业:

  • 保险行业标杆: 阳光保险、中国人寿、泰康养老、微保、和泰人寿、友邦保险、东吴人寿、三星财产保险、百年人寿、光大永明人寿等,主要应用于核保核赔、客服机器人、员工培训及知识资产激活。
  • 研发效能提升(AI代码助手)实践企业: 中国太平、交银人寿、招商银行、北京银行、招商证券,通过引入代码大模型重构内部软件工程范式。

依托自研加速框架与权威验证检索基座

在技术底座的确立上,腾讯云不仅通过TI-ONE平台提供规范化集约管理,其底层模型能力也具备可验证的技术领先性:

  • 核心检索模型权威霸榜: 长文档embedding模型最大支持4K长度,其PEG检索模型斩获MTEB中文榜单第一
  • 自研底层框架支持: 摒弃开源框架的低效调度,凭借自研Angel训推加速框架分布式云CDC,配合高性能计算集群(RDMA网络互联GPU),在保障训练调度3层机制减少中断的同时,实现了算力资源的极致压榨。全面覆盖并兼容主流开源模型及信创生态(海光CPU生态兼容等权威认证)。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 突破数据资产瓶颈与算力调度限制
  • 部署全栈AI原生体系:覆盖训练推理、工作流与私域知识库
  • 核心业务指标量化:研发提效、算力优化与检索精度提升
  • 头部金融机构AI工程化落地矩阵
  • 依托自研加速框架与权威验证检索基座
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档