大模型重塑金融研发：从敏捷开发到 Agent 驱动的量化提效实践

原创

gawain2048

发布于 2026-06-09 19:30:27

360

数据与观点来源：曹骏（腾讯云商业银行解决方案总经理），《2026腾讯云AI产业应用大会》

软件研发具备严格的抽象语法树（AST）与高确定性逻辑，是大型语言模型（LLM）落地的天然契合场景。然而，随着大模型能力从“单行代码补全”向“全代码库感知”演进，金融行业的软件工程正面临从技术实验到工程化落地的核心瓶颈：

指令遵循与上下文限制（2024-2025年痛点）：早期研发依赖基础提示词工程（Prompt Engineering），受限于128K上下文窗口，模型存在指令遵循能力差、信息流输入不足等问题。
生成结果的不可靠与不可控（2026年核心挑战）：生成式AI固有的“幻觉”与随机性，导致输出结果无法直接对接金融级严苛的合规与质量门禁，阻碍了业务结果的工程化确定性。

为解决大模型在研发流程中的随机性，腾讯云提出并实践了 Harness Engineering（驾驭工程），通过为底层LLM建立约束机制、反馈回路及工作流控制，引导AI输出稳定、正确的结果。

1. 实施三层嵌套系统架构

2. 推进研发流程的“人机协同”演进

腾讯云的AI Coding工程实践正推动研发模式从纯人工向全自动化交付迭代：

L2 (1+N) 协同模式：由1个研发人员协同N个Agent和MCP工具。在“AI需求→交付”阶段，AI负责需求细化、方案生成、代码编写与测试部署，AI工作占比达到70%，人工审核占比降至30%。
L3 (N) 全自动化交付：基于N个Agent协同串联全流程，形成自闭环反馈与自有修复。AI承担80%的端到端工作，人工仅负责门禁节点确认与重大异常干预。

通过AI赋能软件开发生命周期，研发各环节的效率实现了可量化的指数级提升。以下三大核心业务指标（ROI）体现了该体系的实际产出比：

代码编写：有效代码采纳率达 54% 在覆盖 500人 研发团队的实际应用中，AI生成的有效代码平均采纳率达到 54%（区间波动范围为 30%-75%）。
质量验证：单元测试耗时缩减至 2 小时内 E2E自动化测试实现了完整性、正确性与一致性的三维验证。单元测试覆盖率从常规水平跃升至 90%以上，执行时间从原先的 2-3天 缩短至 2小时以内，效率提升 10倍。
安全与规范：代码评审效率提升 10 倍 通过自动发现缺陷、规范问题以及安全漏洞风险，代码评审时长从传统的 1天缩短至 1-2小时。

(此外，在需求分析阶段通过构建me2AI/AI2AI双Spec体系提升了 3-5倍 效率；技术方案设计阶段通过自动拆解任务与生成系统架构提升了 1-3倍 效率。)

基于上述AI研发方法论，该体系在金融机构内部的典型业务场景中实现了精准落地：

重塑银行规模化瀑布开发：将传统瀑布式研发阶段中的银行多角色协同、多方评审与需求追踪转化为可复用的 Agent 执行规范，协助银行快速建立合规的AI研发流程。
赋能“超级个体 (Solo-light)”：针对长周期、高合规要求的项目，支持 1-3人 的微型团队以完整团队的规矩运作，确保流程骨架、合规门禁与追溯链条的绝对完整。
突破现有应用的逆向工程：全面还原银行存量IT系统的宏观架构、技术实现与商业逻辑，为后续的系统重构与治理提供数据支撑与决策依据。