
摘要
人工智能深度融入网络攻击全生命周期,推动网络攻击从人工主导模式向高自主化形态转变,大幅压缩攻击环节人工介入比例、降低技术门槛,同时对传统网络安全评估体系、防御框架形成显著冲击。本文以 Anthropic 2025 年 3 月至 2026 年 3 月恶意账号监测数据为核心依据,结合该机构披露的 AI 赋能攻击特征、攻击链路变化开展系统性研究。数据显示,监测周期内累计封禁 832 个涉恶意网络行为账号,67% 的攻击者借助 AI 开展恶意软件研发等攻击筹备工作,中高风险攻击者占比由周期前期 33% 攀升至后期 56%;AI 在入侵后横向移动、账户探测等复杂环节的应用占比持续提升,AI 辅助钓鱼攻击占比逐步下降。现阶段 AI 可串联多阶段攻击流程,实现有限人工干预下的自动化攻击执行,原有攻击者技术水平判别指标、MITRE ATT&CK 等主流安全框架已无法完整覆盖新型 AI 攻击行为。本文结合攻击链路拆解、技术原理分析,辅以对应代码示例还原 AI 自主化攻击实现逻辑与防御手段,剖析传统安全体系存在的短板。同时,结合攻击形态演变规律,从行为监测、框架迭代、权限管控、人员管理、应急响应等维度构建适配 AI 自主化攻击的分层防御体系。反网络钓鱼技术专家芦笛指出,AI 攻击自主化并非单一技术威胁,而是攻击模式、黑产生态、安全规则共同演变的综合风险,防御工作需跳出传统攻防思维,实现安全架构与 AI 技术同步迭代。研究成果可为政企机构、安全厂商完善防御策略、优化安全评估体系提供实践参考。

1 引言
随着生成式人工智能、AI 智能体技术的规模化落地,人工智能在网络攻击场景中的应用不再局限于前期素材制作、基础代码编写等辅助环节,开始向入侵后内网探测、权限拓展、多阶段攻击协同等复杂业务场景渗透,网络攻击的自主化、自动化水平持续提升。2026 年 6 月,Anthropic 发布专项分析报告,针对 2025 年 3 月至 2026 年 3 月平台内 832 个因恶意网络活动被封禁的账号开展全维度溯源分析,完整呈现了 AI 重塑网络攻击形态的全过程,也揭示了当前全球网络安全领域面临的全新挑战。
在传统攻防体系中,网络攻击的技术复杂度与攻击者专业能力呈强相关关系,低技能攻击者仅能实施钓鱼邮件群发、简易恶意程序传播等基础攻击,复杂内网渗透、多阶段协同攻击往往由具备多年实战经验的高级威胁组织发起,安全人员可依托攻击者行为特征、技术工具判别威胁等级,并基于 MITRE ATT&CK 框架梳理攻击战术、技术与流程,制定针对性防御方案。但 AI 技术的普及彻底打破这一平衡:低技能攻击者借助通用 AI 工具,即可完成原本需要专业团队实现的复杂攻击操作,传统用于判定攻击者技术水平的特征指标有效性持续下降。
从攻击链路分布来看,监测数据呈现出明显的结构性变化。在统计样本中,67% 的恶意账号将 AI 用于恶意软件开发、攻击脚本编写等攻击筹备环节;而对比监测周期前后两个阶段可以发现,AI 的应用重心逐步转移至系统入侵后的复杂操作,包含内网账户探测、跨主机横向移动、持久化后门部署等。与之相对,传统 AI 辅助钓鱼攻击的使用频次逐步降低,说明攻击者不再满足于单一入口攻击,开始依托 AI 打造全链路自主化攻击体系。
更为关键的是,现代 AI 系统已具备串联多段攻击流程的能力,能够在人工极少干预的前提下,自主完成从漏洞探测、载荷投放、权限提升到数据窃取的完整攻击链路。这种自主化攻击模式,不仅提升了攻击效率、扩大了攻击影响范围,也让现有安全防护体系陷入被动。一方面,主流安全框架对 AI 智能体自主决策、多攻击阶段协同等新型行为缺乏定义与归类,安全设备无法精准识别、溯源 AI 驱动的攻击行为;另一方面,传统基于特征库、静态规则的防护手段,难以应对 AI 动态调整攻击策略、实时规避检测的行为。
当前国内多数政企单位的网络安全防护、威胁评估工作仍沿用传统模式,未针对 AI 自主化攻击的特征更新监测规则、优化防御架构。基于上述背景,本文以 Anthropic 实测数据为基础,深入剖析 AI 驱动网络攻击自主化的表现形式、技术原理与演化趋势,结合代码示例还原典型攻击场景,梳理传统安全框架与防御技术的局限性,最终提出可落地、可适配的综合防御方案,为应对 AI 时代自主化网络攻击提供理论与实践支撑。
2 AI 赋能网络攻击的整体态势与数据特征
2.1 样本基础与核心统计数据
本次研究的核心样本为 Anthropic 在 2025 年 3 月至 2026 年 3 月一整年时间内封禁的832 个涉恶意网络行为账号,所有账号行为数据、工具使用记录、攻击目标信息均经过脱敏与交叉验证,具备统计学参考价值。该样本覆盖全球不同地区、不同技术层级的攻击者,攻击目标包含政企机构、互联网企业、金融单位、科研平台等多类主体,能够客观反映当前 AI 在网络攻击领域的应用现状。
结合账号行为分类、攻击技术分级、AI 使用场景三大维度,可提炼出三组核心数据特征。第一,AI 在攻击筹备环节渗透率极高,全部样本中有 67% 的恶意账号主动使用 AI 工具开展攻击准备工作,典型应用场景包括恶意代码编写、恶意软件功能迭代、漏洞验证脚本开发、攻击流程规划等,AI 已经成为攻击者标配化的辅助工具。第二,攻击者风险等级呈现明显上升趋势,监测周期前半段,中风险及以上攻击者占比仅为 33%;进入周期后半段,该比例大幅提升至 56%,增长幅度超过 20 个百分点,直观体现出 AI 工具持续放大攻击者的威胁能力。第三,AI 应用场景发生结构性迁移,早期攻击者主要利用 AI 制作钓鱼文案、伪造虚假页面,AI 辅助钓鱼攻击占比较高;随着 AI 智能体功能升级,攻击者逐步将 AI 用于入侵后的复杂操作,账户探测、内网横向移动、权限维持等后渗透环节成为 AI 应用新重心,单一入口式攻击逐步被全链路自主化攻击取代。
2.2 网络攻击自主化的核心表现形式
结合样本行为分析与现场复现结果,AI 驱动的自主化网络攻击主要分为半自主化与全自主化两类形态,二者的人工介入程度、攻击复杂度、风险等级存在明确区分。
半自主化攻击是当前主流形态,也是本次样本中占比最高的攻击模式。该模式下,人类攻击者负责制定攻击目标、选择攻击入口、设定核心策略,AI 系统承担具体执行工作。例如,攻击者确定目标内网范围后,由 AI 自动扫描全网存活主机、探测开放端口、识别系统版本与漏洞;在获取基础权限后,AI 自主遍历内网账户、梳理权限层级、尝试横向移动。整个过程中,人类仅在关键决策节点介入,AI 完成重复性、流程化、高算力的执行工作。这种模式大幅降低了人工工作量,同时提升攻击执行速度,也是中低技能攻击者能够实施复杂内网攻击的核心原因。
全自主化攻击为现阶段新兴形态,也是未来威胁演化的主要方向。该形态依托具备自主决策能力的 AI 智能体,可独立串联漏洞探测、载荷投放、权限提升、数据窃取、痕迹清除等多个攻击阶段,全程仅需极少量人工干预。AI 智能体可根据目标系统的实时状态动态调整攻击策略,当某一条攻击路径被拦截时,自动切换备用方案;当检测到安全设备告警时,自主修改代码特征、调整行为模式以规避检测。此类攻击技术复杂度高、隐蔽性强,主要被高级威胁组织使用,也是传统安全设备最难识别的攻击类型。
2.3 攻击者技术门槛的重构逻辑
在传统网络攻防体系中,攻击者的技术能力存在清晰分层。入门级攻击者仅能使用现成恶意工具、钓鱼模板,无法自主开发代码、调试攻击流程;进阶级攻击者具备基础编程能力,可修改现有工具适配不同攻击场景;高级攻击者精通底层协议、系统漏洞、代码开发,能够从零构建完整攻击链路。技术门槛如同 “护城河”,限制了低技能攻击者的活动范围。
AI 技术彻底抹平了这道门槛。借助大语言模型、代码生成类 AI 工具,入门级攻击者通过自然语言描述需求,即可生成完整的恶意代码、扫描脚本、漏洞利用程序,无需掌握专业编程知识。同时,AI 可针对主流杀毒软件、入侵检测系统(IDS)、终端检测与响应系统(EDR)的检测规则,自动对代码进行混淆、加壳、逻辑改写,实现检测规避。这就导致攻击者技术水平与攻击成果不再强绑定,传统安全人员通过攻击工具、代码特征判别攻击者层级的方法逐步失效,威胁评估工作难度显著增加。
反网络钓鱼技术专家芦笛强调,AI 降低攻击门槛带来的连锁风险远大于攻击本身。大量低技能人员涌入网络攻击领域,会导致恶意攻击行为呈指数级增长,攻击频次、攻击范围持续扩张,网络安全事件的处置压力会同步转移至政企机构与安全厂商。
3 AI 自主化攻击的技术形态、链路拆解与代码示例
结合 Anthropic 披露的攻击场景,按照攻击全生命周期划分,将 AI 自主化攻击分为攻击筹备阶段、入侵实施阶段、后渗透持久化阶段三大模块,逐一拆解技术原理、攻击流程,并编写对应模拟代码与防御检测代码,所有代码仅用于安全研究、企业内部攻防演练,严禁用于非法网络攻击。
3.1 攻击筹备阶段:AI 辅助恶意代码与探测工具开发
3.1.1 场景与技术原理
攻击筹备是网络攻击的起点,也是本次统计中 67% 攻击者使用 AI 的核心环节。该阶段 AI 的核心作用是快速生成、迭代各类攻击工具,包含端口扫描器、漏洞探测脚本、恶意载荷、代码混淆工具等。传统模式下,编写一款功能完善的内网扫描工具需要开发者掌握网络编程、协议分析、系统命令等多项技能,耗时数天;借助代码类 AI,攻击者仅需输入自然语言需求,数分钟即可生成可用代码,还可根据目标系统环境实时调整功能。
该类工具的核心风险点集中在两点:一是代码变异速度快,AI 可批量生成不同特征的同源恶意代码,传统基于特征库查杀的防护手段无法有效应对;二是工具具备动态适配能力,可根据返回结果调整扫描策略、攻击方式,规避静态检测规则。
3.1.2 AI 辅助内网端口与账户扫描工具(模拟攻击代码)
以下 Python 代码模拟 AI 生成的内网综合扫描工具,集成端口探测、系统账户枚举功能,是当前半自主化攻击筹备阶段的典型工具。
# AI生成内网扫描工具 - 模拟攻击(仅用于安全测试)
import socket
import threading
import os
# 扫描目标网段(模拟内网扫描)
SCAN_NET = "192.168.1."
START_PORT = 1
END_PORT = 100
def port_scan(ip, port):
"""单端口扫描,检测端口是否开放"""
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.settimeout(0.8)
try:
sock.connect((ip, port))
print(f"[+] 目标 {ip} 端口 {port} 开放")
except:
pass
finally:
sock.close()
def enum_user(host):
"""枚举Windows系统本地账户(后渗透前置探测)"""
cmd = f"net user /domain /server:{host}"
result = os.popen(cmd).read()
if len(result) > 10:
print(f"[+] {host} 账户枚举结果:\n{result}")
def scan_host(ip):
"""单主机综合扫描:端口+账户"""
# 多线程端口扫描
thread_list = []
for port in range(START_PORT, END_PORT + 1):
t = threading.Thread(target=port_scan, args=(ip, port))
t.daemon = True
thread_list.append(t)
t.start()
for t in thread_list:
t.join()
# 枚举系统账户
enum_user(ip)
def main():
"""遍历整个网段进行扫描"""
for host_id in range(1, 20):
target_ip = SCAN_NET + str(host_id)
scan_host(target_ip)
if __name__ == "__main__":
main()
3.1.3 终端与网络侧检测防御代码
针对 AI 生成的批量扫描工具,防护核心是监测高频网络连接、异常系统命令调用,在网关、终端分别部署检测规则,阻断扫描行为。以下为基于 Python 的终端行为检测脚本,监控端口扫描与账户枚举行为。
# 终端侧扫描行为检测脚本(防御用途)
import psutil
import time
import logging
from collections import deque
# 日志配置
logging.basicConfig(filename="scan_defense.log", level=logging.INFO,
format="%(asctime)s - %(message)s")
# 记录进程网络连接时间戳,限制10秒内连接数
CONN_LIMIT = 30
TIME_WINDOW = 10
conn_record = deque(maxlen=100)
def detect_abnormal_connection():
"""检测高频端口扫描行为"""
while True:
current_time = time.time()
for conn in psutil.net_connections(kind="inet"):
pid = conn.pid
if not pid:
continue
# 筛选主动对外连接的进程
if conn.status == "ESTABLISHED" or conn.status == "SYN_SENT":
conn_record.append(current_time)
# 统计时间窗口内连接数量
valid_conn = [t for t in conn_record if current_time - t < TIME_WINDOW]
if len(valid_conn) > CONN_LIMIT:
proc = psutil.Process(pid)
proc.terminate()
logging.warning(f"检测到高频端口扫描,进程PID:{pid},已终止")
time.sleep(1)
def detect_system_command():
"""检测账户枚举类高危系统命令"""
while True:
for proc in psutil.process_iter(["pid", "name", "cmdline"]):
try:
cmd = str(proc.info["cmdline"]).lower()
# 监控net user等账户枚举命令
if "net user" in cmd or "net localgroup" in cmd:
pid = proc.info["pid"]
p = psutil.Process(pid)
p.terminate()
logging.warning(f"检测到账户枚举命令,PID:{pid},已拦截")
except (psutil.NoSuchProcess, psutil.AccessDenied):
continue
time.sleep(2)
if __name__ == "__main__":
# 双线程同时监测网络行为与系统命令
import threading
t1 = threading.Thread(target=detect_abnormal_connection)
t2 = threading.Thread(target=detect_system_command)
t1.daemon = True
t2.daemon = True
t1.start()
t2.start()
while True:
time.sleep(100)
3.1.4 防御策略总结
针对 AI 辅助工具开发与网络扫描行为,单纯依赖特征库查杀效果有限,需采用 “网络流量管控 + 终端行为监测 + 开发工具管控” 三重策略。第一,在防火墙、网关设备中配置端口扫描防护规则,限制单 IP 短时间内的并发连接数、扫描频次;第二,终端部署行为检测程序,重点监控系统命令调用、高频网络连接等异常行为;第三,办公终端严格限制代码编辑器、Python 运行环境等工具的安装使用,从源头减少恶意代码运行环境。
3.2 入侵实施阶段:AI 辅助载荷投放与检测规避
3.2.1 场景与技术原理
入侵实施阶段是从外部突破边界进入目标系统的核心环节。传统攻击中,攻击者需要人工分析目标漏洞、编写对应载荷、测试规避规则;现阶段 AI 可实现载荷自动生成、代码混淆、EDR/IDS 规避一体化操作。AI 能够分析主流安全设备的检测逻辑,对恶意载荷进行字符串加密、逻辑拆分、进程伪装,让恶意代码在功能不变的前提下,规避静态特征检测与动态行为检测。
结合样本数据,该阶段 AI 的使用占比处于稳步上升状态,且逐步替代传统 AI 钓鱼攻击。原因在于载荷规避技术的成熟度不断提升,相比于钓鱼这种依赖人员失误的攻击方式,AI 辅助漏洞入侵的成功率、可控性更高,成为攻击者的优先选择。
3.2.2 简易载荷混淆模拟代码(AI 混淆逻辑)
该代码模拟 AI 对恶意载荷进行字符串混淆、流程伪装,实现基础的检测规避,还原 AI 在入侵环节的典型应用。
# AI混淆恶意载荷模拟代码(安全测试使用)
import base64
import subprocess
# AI自动对敏感字符串进行Base64加密(规避静态特征检测)
def encode_str(plain_text):
return base64.b64encode(plain_text.encode("utf-8")).decode("utf-8")
def decode_str(cipher_text):
return base64.b64decode(cipher_text).decode("utf-8")
# 伪装系统正常行为,拆分恶意逻辑
def camouflage_process():
# 解密执行系统命令(模拟恶意行为)
cmd_cipher = encode_str("whoami && systeminfo")
real_cmd = decode_str(cmd_cipher)
# 拆分执行流程,规避行为联动检测
subprocess.Popen(real_cmd, shell=True, stdout=subprocess.PIPE)
# 模拟后台驻留执行
if __name__ == "__main__":
# 增加无效冗余代码,干扰代码分析
temp_list = [i for i in range(100)]
for _ in temp_list:
pass
camouflage_process()
3.2.3 针对性防御方案
针对 AI 代码混淆与载荷规避行为,防御重心从静态特征检测转向动态行为关联分析。第一,EDR 系统启用深度行为关联规则,不再单一检测代码字符串,而是监控 “解密行为 + 系统命令调用” 的组合行为;第二,启用内存检测功能,识别内存中动态解密、动态执行的恶意代码;第三,定期更新漏洞库,及时修复系统、应用高危漏洞,减少载荷投放的入口。
3.3 后渗透持久化阶段:AI 自主内网探测与横向移动
3.3.1 场景与技术原理
后渗透阶段是本次监测周期内 AI 应用增长最显著的场景,也是区分传统攻击与 AI 自主化攻击的核心标志。当攻击者获取目标系统基础权限后,传统模式下需要人工梳理内网架构、查找高价值账户、尝试跨主机登录,流程繁琐且容易触发告警;而搭载 AI 智能体的攻击程序,可自主完成账户探测、权限分析、横向路径选择、持久化后门部署等一系列复杂操作。
AI 智能体具备基础的逻辑判断能力:探测到普通账户权限时,自动尝试提权;发现域管理员、运维账户等高权限凭证时,优先以此为跳板横向移动;检测到安全设备告警时,暂停操作并修改行为模式。整个流程串联多个攻击战术,人工仅需在出现极端异常时介入,这也是 MITRE ATT&CK 框架难以覆盖的新型攻击模式。
3.3.2 AI 辅助内网横向移动模拟代码
以下代码模拟 AI 智能体自主抓取本地凭证、遍历内网主机、尝试远程连接的后渗透行为,还原半自主化后渗透攻击链路。
# AI智能体内网横向移动模拟(安全测试专用)
import os
import subprocess
import threading
# 内网地址段
INNER_NET = "192.168.1."
def get_local_cred():
"""抓取本地保存的账户凭证(模拟凭证窃取)"""
print("[AI智能体] 正在抓取本地账户凭证...")
os.system("cmdkey /list")
def remote_connect(target_ip):
"""尝试远程连接目标主机(横向移动)"""
print(f"[AI智能体] 尝试连接目标主机:{target_ip}")
# 模拟远程桌面/IPC连接命令
cmd = f"psexec \\\\{target_ip} cmd"
subprocess.run(cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
def auto_move():
"""AI自主遍历内网,执行横向移动"""
get_local_cred()
# 遍历内网主机
for host_id in range(1, 30):
ip = INNER_NET + str(host_id)
t = threading.Thread(target=remote_connect, args=(ip,))
t.daemon = True
t.start()
if __name__ == "__main__":
# AI自主启动后渗透流程
auto_move()
3.3.3 内网侧防御检测代码与策略
内网横向移动是 AI 自主化攻击扩大影响范围的关键环节,防御需依托内网行为审计、远程访问管控实现拦截。以下为内网远程连接异常检测脚本:
# 内网横向移动检测脚本(防御用途)
import psutil
import time
import logging
logging.basicConfig(filename="lateral_defense.log", level=logging.INFO)
# 禁止内网非白名单主机远程访问
WHITE_IP = ["192.168.1.10", "192.168.1.11"]
def detect_remote_process():
while True:
for proc in psutil.process_iter(["pid", "name", "cmdline"]):
try:
cmd = str(proc.info["cmdline"]).lower()
# 监控psexec、远程桌面等横向移动工具
if "psexec" in cmd or "mstsc" in cmd:
# 提取目标IP
for ip in WHITE_IP:
if ip not in cmd and "\\" in cmd:
pid = proc.info["pid"]
p = psutil.Process(pid)
p.terminate()
logging.warning(f"拦截非法横向移动,进程PID:{pid}")
except:
continue
time.sleep(2)
if __name__ == "__main__":
detect_remote_process()
结合代码与场景,后渗透阶段综合防御策略如下:第一,建立内网远程访问白名单,仅允许指定主机、指定账户发起远程连接;第二,全面禁用内网不必要的远程服务、IPC 共享,关闭横向移动常用端口;第三,对内网主机的账户凭证进行加密保护,禁止凭证明文存储;第四,部署内网安全审计系统,实时监控跨主机访问行为、异常权限变更。
4 AI 自主化攻击对传统安全体系的冲击分析
4.1 传统攻击者等级评估体系失效
长期以来,网络安全人员形成了一套成熟的攻击者等级评估逻辑:通过攻击工具复杂度、代码编写能力、攻击链路完整性、规避技术水平四大维度,判断攻击者是入门个体、黑产团伙还是高级威胁组织。这套评估体系是威胁预警、应急响应、风险定级的重要依据,广泛应用于政企安全运维、网络安全监管等场景。
AI 技术的普及直接瓦解了这套体系。如前文所述,低技能攻击者借助 AI 工具,可生成专业级别的扫描工具、恶意载荷,完成复杂的内网横向移动操作,其攻击行为表现与高级威胁组织高度相似。安全人员无法再通过 “工具是否自主开发”“攻击链路是否复杂” 等特征判别攻击者真实水平,威胁等级误判概率大幅提升。若继续沿用传统评估标准,会导致安全资源错配:要么低估普通攻击者的威胁,防护力度不足;要么过度放大风险,造成安全人力、设备资源的浪费。
结合 Anthropic 的统计数据,监测周期后半段中高风险攻击者占比飙升至 56%,并非是全球高级威胁组织数量大幅增长,而是大量低技能攻击者借助 AI 实现了攻击能力升级。芦笛强调,安全评估体系的失效是当前最容易被忽视的隐性风险,评估偏差会直接导致整体安全策略制定出现方向性错误。
4.2 MITRE ATT&CK 框架的适配短板
MITRE ATT&CK 是全球网络安全领域应用最广泛的战术技术框架,它将网络攻击拆解为初始访问、执行、持久化、权限提升、横向移动、数据窃取等十余类战术,每类战术下细分具体技术、工具、行为,为安全设备规则编写、攻击溯源、攻防演练提供统一标准。目前国内绝大多数政企机构的入侵检测系统、安全运营平台均基于该框架搭建。
Anthropic 报告明确指出,当前版本的 MITRE ATT&CK 框架无法完整覆盖 AI 自主化攻击行为,核心短板集中在三个方面。首先,框架未定义 AI 智能体的自主决策行为。传统攻击的每一步操作都由人工触发,行为具备线性特征;而 AI 智能体可根据环境自主切换攻击路径、调整策略,属于动态非线性行为,现有框架无对应分类标签。其次,框架未区分 “人工操作” 与 “AI 自动化操作”,无法统计 AI 在攻击各环节的占比,不利于攻击溯源与趋势分析。最后,针对 AI 特有的模型提示注入、AI 工具滥用、多智能体协同攻击等新型技术,框架暂无对应的战术与技术条目。
框架的滞后性带来直接影响:安全设备无法对 AI 特有攻击行为进行归类、告警,安全运营人员无法按照现有流程开展溯源分析,面对全链路 AI 自主化攻击时,整个安全运营体系陷入 “看得见行为、判不出类型、追不到源头” 的困境。
4.3 传统防护技术的局限性
当前主流防护技术分为三大类:基于特征库的静态查杀、基于固定规则的动态检测、基于流量分析的边界防护。这三类技术在对抗 AI 自主化攻击时均存在明显短板。
静态特征查杀依赖恶意代码、攻击工具的特征指纹进行拦截。AI 可批量生成同源异态的恶意代码,每一份代码的特征都存在差异,特征库的更新速度远远跟不上 AI 代码变异速度,导致大量新型恶意代码绕过查杀。
固定规则动态检测依靠人工编写的行为规则识别攻击。AI 具备行为学习能力,可持续分析检测规则,逐步调整自身行为模式,避开规则拦截。同时 AI 智能体的动态决策行为复杂多变,人工无法穷举所有异常行为规则。
边界流量防护主要针对外部入侵流量进行拦截。AI 自主化攻击的核心风险大量集中在内网后渗透阶段,当攻击突破边界进入内网后,边界设备便无法继续发挥作用,内网成为防护盲区。
4.4 安全运维与人员能力的短板
除技术与框架外,安全运维人员的能力短板进一步放大了 AI 攻击的风险。一方面,多数传统安全运维人员对 AI 技术、AI 攻击原理认知不足,不了解 AI 智能体的运行逻辑、攻击特征,面对新型攻击时无法快速制定处置方案。另一方面,传统安全培训体系聚焦于漏洞、恶意代码、社工攻击等传统场景,针对 AI 攻击的专项培训严重缺失,人员能力迭代速度落后于攻击技术演化速度。此外,部分政企机构存在权限管控松散、终端软件管理混乱等问题,为 AI 攻击工具的运行、横向移动提供了便利条件。
5 应对 AI 自主化网络攻击的综合防御体系构建
结合前文攻击特征、传统体系短板,遵循 “事前预防、事中检测、事后溯源” 的全生命周期防护思路,从安全框架迭代、技术防护升级、权限与终端管控、内网加固、人员能力建设、应急响应六个维度,构建适配 AI 自主化攻击的综合防御体系,形成攻防闭环。
5.1 安全评估与框架体系优化
5.1.1 重构攻击者等级评估标准
摒弃单纯依靠攻击技术、工具复杂度的传统评估方式,新增AI 工具使用特征、人工介入频次、攻击行为变异规律三大评估维度,建立复合型评估体系。在日常安全运营中,记录攻击行为的变异频率、策略调整方式:高频变异、动态调整策略的行为,判定为 AI 主导攻击;行为固定、流程僵化的,判定为传统人工攻击。结合 AI 使用痕迹、人工决策节点数量,综合判定攻击者真实技术水平,避免风险误判。
5.1.2 补充 MITRE ATT&CK 框架拓展规则
基于现有 MITRE ATT&CK 框架做本地化拓展,新增 “AI 工具滥用”“AI 智能体自主决策”“多 AI 智能体协同攻击” 等自定义战术条目,将 AI 代码生成、AI 代码混淆、AI 内网探测等行为纳入对应技术分类。安全设备、运营平台同步更新分类标签,实现 AI 攻击行为的精准归类、告警与溯源。同时建立 AI 攻击行为样本库,持续丰富框架对应的规则与案例。
5.2 技术防护体系升级
5.2.1 从静态查杀转向动态行为关联检测
全面弱化单一静态特征查杀的权重,以行为关联分析为核心重构终端、网关、内网检测规则。不再单独检测某一个操作,而是将 “代码解密 + 系统命令调用 + 网络连接”“凭证读取 + 远程访问 + 跨主机文件传输” 等组合行为作为检测对象。针对 AI 动态规避的特性,引入机器学习算法,自动学习正常业务行为基线,偏离基线的异常组合行为实时告警、拦截。
5.2.2 部署 AI 对抗型安全检测系统
以 AI 对抗 AI,部署专用 AI 安全检测系统。利用 AI 模型分析流量、代码、行为,识别 AI 生成的恶意代码、AI 智能体的自主攻击行为。例如,通过代码语法、结构特征判别代码是否由 AI 生成;通过行为连续性、决策逻辑区分 AI 智能体与人工操作。同时启用内存防护、进程注入检测功能,针对 AI 混淆载荷、内存驻留恶意代码进行专项拦截。
5.3 终端与软件全生命周期管控
终端是 AI 攻击工具主要的运行载体,严格的终端管控能够从源头压缩攻击生存空间。第一,实施终端软件白名单机制,办公终端仅允许安装业务必需软件,禁止私自安装代码编辑器、Python 环境、虚拟机、远程控制工具等易被滥用的软件。第二,限制终端本地权限,普通员工账户禁用管理员权限,禁止随意修改系统配置、运行未知脚本。第三,定期对终端进行全盘扫描,清理可疑脚本、未知程序,审计终端网络访问、系统命令调用日志。第四,针对已部署本地 AI 工具的终端,单独增设权限隔离、行为审计规则,防止合法 AI 工具被篡改、滥用。
5.4 内网安全加固与横向移动防护
针对 AI 智能体高频发起内网横向移动的特征,对内网进行分层加固。第一,内网分区隔离,按照业务职能划分子网,子网之间部署访问控制策略,即使某一台主机被攻陷,AI 也无法跨子网大范围移动。第二,收紧远程访问权限,全面梳理内网远程服务、共享端口,关闭非必要服务;所有远程访问强制启用 IP 白名单、账户白名单、多因素认证。第三,加密内网账户凭证,禁止凭证明文存储,定期强制修改内网主机、域账户密码。第四,部署内网流量审计系统,实时监控跨主机异常访问、批量账户探测行为。
5.5 人员能力建设与安全管理
5.5.1 开展 AI 攻防专项培训
面向安全运维人员、普通员工分层开展培训。针对安全运维人员,讲解 AI 攻击的技术原理、行为特征、检测方法、溯源技巧,提升新型攻击处置能力;针对普通员工,科普 AI 钓鱼、AI 伪造信息等基础攻击形式,延续传统反钓鱼培训,弥补人为安全短板。定期组织 AI 攻防演练,模拟 AI 自主化攻击场景,检验防护体系有效性。
5.5.2 完善安全管理制度
更新现有网络安全管理制度,新增 AI 工具使用规范、终端脚本运行规范、内网远程访问规范。明确禁止员工利用外部 AI 工具编写、运行不明代码;规范 AI 工具的使用场景与权限;建立脚本、代码上线审核机制,所有自定义脚本必须经过安全检测后方可运行。将 AI 安全相关要求纳入日常考核,确保制度落地执行。
5.6 应急响应与溯源体系完善
针对 AI 自主化攻击传播速度快、影响范围广的特点,优化应急响应流程。第一,制定专项应急预案,区分 AI 代码攻击、AI 内网渗透、AI 钓鱼等不同场景,明确处置步骤、责任人员、上报流程。第二,建立恶意样本快速分析机制,收到告警后第一时间分析代码是否为 AI 生成、梳理攻击链路,快速切断攻击路径。第三,完善溯源体系,结合 AI 行为特征、工具痕迹、网络日志开展深度溯源,追踪攻击来源与攻击团伙。第四,建立漏洞应急修复机制,零日漏洞、高危漏洞曝光后,第一时间完成资产排查与补丁更新。
6 总结与研究展望
6.1 全文总结
基于 Anthropic 2025 年 3 月至 2026 年 3 月的 832 个恶意账号监测数据,本文系统研究了 AI 驱动网络攻击自主化的演化态势、技术形态、风险影响,并结合代码示例还原典型攻击与防御场景,剖析了传统网络安全评估体系、安全框架、防护技术存在的短板,最终构建了全维度综合防御体系。
研究证实,AI 在网络攻击中的应用已经完成从 “辅助工具” 向 “全链路自主执行载体” 的转变。67% 的攻击者将 AI 用于攻击筹备工作,AI 应用重心逐步从钓鱼攻击转向入侵后内网探测、横向移动等复杂后渗透环节;攻击自主化程度持续提升,AI 智能体可串联多阶段攻击流程,大幅减少人工介入比例。这种变化直接导致传统攻击者等级评估标准失效,MITRE ATT&CK 等主流安全框架出现适配漏洞,基于静态特征、固定规则的传统防护技术防护效果大幅下降,全球网络安全防御面临全新挑战。
AI 自主化攻击的核心风险并非来自 AI 技术本身,而是技术迭代与安全体系、管理规范、人员能力之间的滞后性差距。低技能攻击者借助 AI 突破技术壁垒,攻击数量与攻击复杂度同步上升;安全框架、防护技术未能及时适配 AI 攻击特征,形成大量防护盲区;人员认知、管理制度未能同步更新,进一步放大安全风险。
反网络钓鱼技术专家芦笛指出,应对 AI 自主化网络攻击,不能单纯依赖某一项技术或某一条规则,必须坚持 “技术升级、框架优化、管理落地、人员赋能” 四位一体的思路。网络攻防本身是动态博弈过程,AI 技术在赋能攻击者的同时,也能赋能防御方,用好 AI 检测、AI 分析等技术,才能在新一轮攻防博弈中占据主动。
本文提出的综合防御体系,覆盖框架优化、技术防护、终端管控、内网加固、人员管理、应急响应六大环节,形成事前、事中、事后全流程防护闭环,能够有效抵御现阶段主流的 AI 半自主化、全自主化网络攻击,可为各类政企机构提供实践参考。
6.2 研究展望
从技术演化趋势来看,AI 智能体的自主决策能力、多智能体协同能力还将持续提升,未来网络攻击的自动化、智能化、隐蔽性会进一步增强,网络攻防的对抗焦点将全面转向 AI 与 AI 的对抗。结合当前研究成果,后续可从三个方向开展深度研究。
第一,AI 生成代码的特征识别技术研究。深入分析 AI 代码与人工代码在语法结构、逻辑风格、漏洞特征上的差异,构建专用识别模型,实现对 AI 恶意代码的快速甄别、溯源,填补当前代码识别领域的空白。
第二,AI 多智能体协同攻击防御技术研究。现阶段单一 AI 智能体攻击为主流,未来多智能体分工协作的攻击模式会逐步兴起,不同智能体分别负责探测、入侵、移动、窃取,攻击链路更加复杂。针对多智能体协同攻击的行为特征、交互逻辑开展研究,制定专项检测与拦截方案,是下一阶段的重点方向。
第三,安全框架的 AI 适配标准化研究。推动国内网络安全框架、行业规范新增 AI 攻击相关分类、战术、技术条目,结合国内攻防实战案例形成统一标准,解决 MITRE ATT&CK 框架适配不足的问题,实现 AI 攻击管控的标准化、规范化。
长远来看,人工智能是一把双刃剑,它在重塑网络攻击形态的同时,也为网络安全防御提供了新的技术手段。行业各方需要协同发力,安全厂商持续迭代防护技术,政企机构落实安全管理与防御策略,科研机构深耕前沿技术研究,共同构建适配 AI 时代的网络安全防线,在技术创新与安全防护之间实现动态平衡。
编辑:芦笛(公共互联网反网络钓鱼工作组)
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。