
一、一个让合规总监睡不着觉的问题
某证券公司准备上线一个AI助手,帮合规部门快速检索监管法规、内部制度、历史处罚案例。
演示效果很好:问“这个营销活动是否合规”,AI三秒给出答案,逻辑清晰、引经据典。
合规总监问了一个问题,全场安静了:
“AI说某条营销文案合规,依据是2023年第X号文。但如果这个文件已经被废止了,AI会知道吗?如果它引用的条款有误,出了问题,谁来负责?”
没有人能回答这个问题。
合规的场景特殊:不只是“给出答案”,必须“给出依据,且依据必须可追溯、可验证、可审计”。
二、金融合规场景的三个特殊要求
要求一:答案必须有“法律效力”背书
AI说“合规”不算。必须说明“根据《证券法》第X条”或“根据证监会2024年第X号文”。引用来源的权威性,决定了答案的可信度。
如果AI的推理过程是黑盒,合规人员不敢直接用。用错了,轻则内部处罚,重则监管问责。
要求二:引用来源必须可验证
不仅仅是“附上文件名”,必须精确到:文件名称 + 发文文号 + 条款编号 + 原文段落。
合规人员拿到答案后的第一件事,不是信任AI,而是打开原始文件验证AI引用是否正确。可验证性是信任的前提。
要求三:版本敏感度极高
法规政策频繁更新。去年合规的,今年不一定合规。AI必须知道:引用的是哪个版本、该版本是否仍然有效、有没有被后续文件修订或废止。
三、技术方案设计
核心思路:答案必须带上“证据链”——让每个结论都能追溯到原始文档的精确位置。
3.1 检索系统的额外要求
传统RAG只需找到相关段落,金融合规RAG额外要求:
3.2 原文出处链数据结构

3.3 来源标注的实现
回答生成时,每个事实性陈述后自动上标引用编号,文末附完整参考文献列表。
生成的回答格式示例(Markdown):

3.4 版本有效性检查
在检索环节增加一道版本过滤:
版本状态标识字段:valid(当前有效)、deprecated(已废止)、superseded(被替代)。被替代的版本需记录替代文件ID和替代依据。
四、没有原文出处的风险
真实案例一:AI“张冠李戴”
某机构用AI做合规审查,AI引用了一份关于私募基金的规定来判断公募基金业务。合规人员没有验证,直接采纳。监管检查时发现引用错误,被通报批评。
如果AI输出了原文出处,合规人员在复核时就能发现“公募业务引用私募规定不合理”,从而避免错误。
真实案例二:引用已废止文件
AI引用了一份两年前的文件。合规人员不放心,自己查了一遍,发现该文件已被废止。如果AI直接给出答案不附出处,这个错误永远不会被发现。
五、技术实现细节
5.1 文档结构化预处理
金融监管文件入库前做精细化处理:
5.2 检索时的来源可靠性打分
按照优先级排序:法律 > 行政法规 > 部门规章 > 规范性文件 > 行业自律规则 > 内部制度。
官方发布渠道的直接采纳,新闻解读仅作参考。从权威性高的来源保证答案的法律效力。
六、落地效果
某金融机构上线合规AI后的数据:
七、可复制路径
第一步:选一个场景试点
选择边界清晰、法规相对固定的场景,如“营销宣传材料合规自检”。建立第一批文档库(10-20份核心法规),跑通检索→生成→来源标注的完整链路。
第二步:建版本管理机制
明确每份文档的有效版本标识规则,建立法规更新同步机制(定时爬取监管官网或人工录入)。
第三步:逐步扩展范围和合规要求
增加法规覆盖范围,逐步接入内部制度、历史处罚案例。引入合规人员反馈闭环,持续优化。
在具体实现上,有金融机构采用 ZGI 作为合规审查的RAG平台,其来源溯源、版本管理、文档结构化能力覆盖了上述全部需求。
八、写在最后
金融行业的AI合规审查,信任不是凭空建立的。
信任来自:每一个回答都有据可查、每一个引用都可验证、每一个结论都可追溯。
输出原文出处看起来是“附上几个字”的小事,但它决定了合规团队敢不敢用、敢不敢信。
没有出处的AI回答,在金融合规这个场景里,等于没有回答。
本文基于金融合规AI实践整理。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。