腾讯大模型安全解决方案：覆盖全生命周期的合规与风险治理

原创

IT资讯研究所

发布于 2026-05-31 21:01:50

1680

随着生成式AI融入企业核心业务，大模型已成为新的IT基础设施，但其面临的安全形势日益严峻。企业在模型开发与部署过程中，正面临以下核心瓶颈：

监管合规压力剧增： 自2021年起，国家密集出台《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》等法规，明确要求备案与安全评估。根据原文数据，2025年近200家已备案大模型企业均须参加国家攻防演练，合规成本与风险显著提升。
开发环境漏洞频发： 传统IT漏洞直接威胁AI资产。例如，常用的开发工具 GitLab Community Edition 存在任意用户登录漏洞 (CVE-2024-45409)，攻击者可绕过签名检查以任意身份登录；流行的对话框架 Open WebUI 存在路径遍历漏洞 (CVE-2024-6707)，允许攻击者上传恶意模型执行任意代码或实现远程命令执行。
模型运行时对抗风险： 模型部署后面临多维度的样本对抗攻击，包括提示词泄漏（如Manus产品曾泄露核心提示词与29个工具链逻辑）、数据泄漏（特定字符组合可触发大模型泄露训练数据中的个人信息）、越狱攻击（绕过审核策略生成违规内容）以及模型后门（保持模型准确率下降仅~2%的情况下植入恶意触发器）。

王璐（腾讯云安全高级解决方案专家） 提出基于腾讯云鼎实验室的评估框架，通过“评估+防护”双轮驱动，覆盖模型开发、训练、部署至应用的全流程。

针对模型生命周期的不同阶段，提供定制化的安全检测能力：

基于实战经验，模拟三类核心攻击路径，验证防御体系的有效性：

腾讯LLM-WAF（大模型智能安全防护网关）： 专为大语言模型设计，支持多模型、多场景、高并发环境下的全链路防护。实时拦截算力滥用、提示词攻击及数据泄露风险，并集成混元内容安全大模型对生成内容进行过滤（涵盖社会、政治、色情、违法等维度）。
腾讯AI-SPM（大模型安全态势感知系统）： 专注于基础设施安全，具备资产测绘与组件识别（80+组件）、大模型风险检测（200+组件漏洞检测、40+POC精准检测）及网络攻击示警（6类漏洞攻击行为监测）能力。

基于真实的攻防演练数据，腾讯大模型安全解决方案在实战中展现出确定的防御效果：

攻防演练战绩： 在 2024年腾讯参加AI大模型专项实网演练 中，腾讯是 唯二未失分 的厂商；在同期沙盘推演中，腾讯作为 胜方并荣获最佳辩手。
检测覆盖度： AI-SPM系统支持对 80+ 大模型组件进行指纹识别，具备 200+ 漏洞检测能力及 40+ POC形式的精准检测能力。
后门隐蔽性指标： 模型后门攻击能在保持模型功能准确率下降幅度控制在 ~2% 的极小范围内，实现恶意触发。

背景： 企业使用GitLab进行代码管理，版本为16.8.0（低于官方推荐的安全版本17.4.1等）。
问题： 存在 CVE-2024-45409 漏洞，攻击者在samp:extensions元素中插入修改后的DigestValue，即可绕过签名检查，以任意用户身份登录。
应对逻辑： 依托AI-SPM的资产测绘与漏洞检测能力，快速识别低版本组件（基于版本的漏洞识别200+），及时推送配置风险与补丁建议。

腾讯云大模型安全解决方案依托于腾讯集团安全与腾讯云安全的深厚积累，具备以下技术确定性：

权威机构实战验证： 腾讯安全团队在 2024年AI大模型专项实网演练 中取得 唯二未失分 的战绩，并通过沙盘推演验证了“瞒天过海”、“偷梁换柱”、“釜底抽薪”等攻防战法。
自研引擎与深度集成： 方案集成了 混元内容安全大模型 用于内容过滤，并针对腾讯云生态（如Deepseek、混元大模型、Qwen2.5等）进行了深度适配，提供从基础设施（HIDS、DSPM）到应用层（LLM-WAF）的一体化防护。
全栈资产管控能力： 腾讯AI-SPM系统具备 80+ 组件识别能力与 200+ 漏洞检测库，能够覆盖从开发环境（GitLab、Jenkins、Jupyter Notebook）到运行环境（PyTorch框架、向量数据库）的全栈资产风险。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。