数据与观点来源:曹骏(腾讯云商业银行解决方案总经理),《2026腾讯云AI产业应用大会》
跨越代码生成的可靠性临界点
软件研发具备严格的抽象语法树(AST)与高确定性逻辑,是大型语言模型(LLM)落地的天然契合场景。然而,随着大模型能力从“单行代码补全”向“全代码库感知”演进,金融行业的软件工程正面临从技术实验到工程化落地的核心瓶颈:
- 指令遵循与上下文限制(2024-2025年痛点):早期研发依赖基础提示词工程(Prompt Engineering),受限于128K上下文窗口,模型存在指令遵循能力差、信息流输入不足等问题。
- 生成结果的不可靠与不可控(2026年核心挑战):生成式AI固有的“幻觉”与随机性,导致输出结果无法直接对接金融级严苛的合规与质量门禁,阻碍了业务结果的工程化确定性。
建立 Agent 驱动的 Harness 驾驭工程
为解决大模型在研发流程中的随机性,腾讯云提出并实践了 Harness Engineering(驾驭工程),通过为底层LLM建立约束机制、反馈回路及工作流控制,引导AI输出稳定、正确的结果。
1. 实施三层嵌套系统架构
- Harness层(运行控制):负责控制流、约束与反馈,确保Agent始终在预设架构轨道内运行,不偏离任务目标。
- Context层(知识记忆):治理信息流,为模型提供准确的历史背景与知识储备。
- Prompt层(具体指令):执行具体的任务交互。
2. 推进研发流程的“人机协同”演进
腾讯云的AI Coding工程实践正推动研发模式从纯人工向全自动化交付迭代:
- L2 (1+N) 协同模式:由1个研发人员协同N个Agent和MCP工具。在“AI需求→交付”阶段,AI负责需求细化、方案生成、代码编写与测试部署,AI工作占比达到70%,人工审核占比降至30%。
- L3 (N) 全自动化交付:基于N个Agent协同串联全流程,形成自闭环反馈与自有修复。AI承担80%的端到端工作,人工仅负责门禁节点确认与重大异常干预。
实现研发全生命周期的指数级跃升
通过AI赋能软件开发生命周期,研发各环节的效率实现了可量化的指数级提升。以下三大核心业务指标(ROI)体现了该体系的实际产出比:
- 代码编写:有效代码采纳率达 54%
在覆盖 500人 研发团队的实际应用中,AI生成的有效代码平均采纳率达到 54%(区间波动范围为 30%-75%)。
- 质量验证:单元测试耗时缩减至 2 小时内
E2E自动化测试实现了完整性、正确性与一致性的三维验证。单元测试覆盖率从常规水平跃升至 90%以上,执行时间从原先的 2-3天 缩短至 2小时以内,效率提升 10倍。
- 安全与规范:代码评审效率提升 10 倍
通过自动发现缺陷、规范问题以及安全漏洞风险,代码评审时长从传统的 1天 缩短至 1-2小时。
(此外,在需求分析阶段通过构建me2AI/AI2AI双Spec体系提升了 3-5倍 效率;技术方案设计阶段通过自动拆解任务与生成系统架构提升了 1-3倍 效率。)
破解金融机构复杂协同与存量治理难题
基于上述AI研发方法论,该体系在金融机构内部的典型业务场景中实现了精准落地:
- 重塑银行规模化瀑布开发:将传统瀑布式研发阶段中的银行多角色协同、多方评审与需求追踪转化为可复用的 Agent 执行规范,协助银行快速建立合规的AI研发流程。
- 赋能“超级个体 (Solo-light)”:针对长周期、高合规要求的项目,支持 1-3人 的微型团队以完整团队的规矩运作,确保流程骨架、合规门禁与追溯链条的绝对完整。
- 突破现有应用的逆向工程:全面还原银行存量IT系统的宏观架构、技术实现与商业逻辑,为后续的系统重构与治理提供数据支撑与决策依据。
构筑闭环自治的AI研发实施路径
基于腾讯的工程实践,金融企业引入大模型AI研发体系应遵循三阶段实施路径,以确保系统稳定性与交付质量:
- 基础筑底期:统一需求模板,沉淀业务规则、术语与系统结构,固化安全、数据、发布等工程研发红线。
- 链路贯通期:串联全流程,打通需求、代码、文档与流水线,建立多级评审门禁与自动化状态同步。
- 闭环自治期:建设多 Agent 协同交付,实现评审未过/测试失败的 卡点自动打回修复,并建立跟踪覆盖率、采纳率、通过率的度量体系。
执行建议:在初期投入阶段,建议抽调少量技术骨干,利用公有云或团体云资源,快速试点并搭建核心的 Harness 体系,验证后再向更多行内系统推广。