搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

多智能体协同自主进化渗透测试系统：提升漏洞挖掘效率与自优化能力
量化验证系统效能与业务价值基于XBOW Validation Benchmarks数据集（来源：文中“XBOW Validation Benchmarks 数据集分析”）的实践显示：数据集规模：含104个环境（简单45、中等51、困难8），覆盖注入型、访问控制漏洞（XSS 23例、默认密码18例、越权15例占比最高），较少涉及密码学错误、SSRF（来源：“XBOW Benchmarks 包含开源与标准化：基于SKILL.md+MCP规范开放技能接口，支持快速扩展；开源评估系统与数据集（XBOW Validation Benchmarks）推动行业基线统一（来源：“所有技能和MCP 都支持快速扩展 ”“开源地址：https://github.com/Neuro-Sploit/xbow-validation-benchmarks”）。（数据来源：XBOW Validation Benchmarks数据集、NeuroSploit战队实践报告、腾讯云黑富松智能渗透挑战赛公开资料）
36220编辑于 2026-04-06
来自专栏爱生活爱编程
【PaperReading】Tools and Benchmarks for Automated Log Parsing
Tools and Benchmarks for Automated Log Parsing 自动日志分析的工具和基准 Jieming Zhu① , Shilin He② , Jinyang Liu③
1.3K21发布于 2021-01-14
来自专栏ADAS性能优化
Misunderstood Benchmarks Are Hurting The Industry and Consumers
The reason that people use inaccurate benchmarks is because these benchmarks make it really easy to simply These benchmarks are known as synthetic benchmarks. Reviews using balanced benchmarks Although there are plenty of reviewers out there using benchmarks in reviewers that use good benchmarks, we also have reviewers that simply don’t use benchmarks at all. That means benchmarks that: utilize real game engines for their 3D benchmarks, like 3DMark benchmarks
54820编辑于 2022-05-13
多智能体协同渗透测试系统将漏洞挖掘成功率提升至58.2%
开发基于XBOW Benchmark的全自动评估系统团队开源了自动化AI智能体评估系统，该系统具备多维度评估能力：漏洞利用成功率：精准测量攻击有效性全链路攻击耗时：量化响应效率 Token消耗分析项目修复了上游官方XBOW Benchmark仓库的多个遗留问题，并开发了与比赛平台API完全兼容的本地接口。腾讯云平台支撑智能攻防技术突破腾讯云黑盲松竞赛平台提供： XBOW Benchmark数据集：104个漏洞环境，覆盖简单(45)、中等(51)、困难(8)三种难度漏洞类型分布：XSS(23)、默认密码数据来源：NeuroSploit战队开源项目（GitHub）、XBOW Validation Benchmarks统计平台、腾讯云黑盲松智能渗透挑战赛官方数据
33220编辑于 2026-04-04
来自专栏云原生生态圈
遵循CIS Docker Benchmarks规范的开源巡检脚本(内附CIS Docker Benchmarks PDF下载)
CIS[1]即Center for Internet Security (CIS) 为安全基准计划提供了定义明确、公正、基于一致性的行业最佳实践来帮助组织评估和增强其安全性
1.7K10发布于 2021-09-24
来自专栏运维专栏
Cluster Setup - CIS Benchmarks（集群设置-CIS基线）
关于 CIS Benchmarks CIS Benchmarks -Default k8s security rules 默认的kubernets的安全准则无论是原生还是通过谷歌或者亚马逊云的定制化 3.1 CSI Benchmarks 详见https://learn.cisecurity.org/benchmarks 最新版本CIS_Kuberntets_Benchmark_v1.6.0.pdf
1.6K22发布于 2021-03-13
来自专栏Reinvent Data Science
Chat with Milvus #3 回顾 - ANN-Benchmarks 测试结果
1588755865 在高维空间中快速进行最近邻搜索已成为一个越来越重要的问题，但是到目前为止，市面上还没有很多客观的比较基准，因此 Erik Bernhardsson 创建了一个 ANN 基准测试工具- ANN-Benchmarks 这星期二的线上问答我们与参加者分享了Milvus ANN-Benchmarks 的性能测试结果，并展开与之相关的讨论。想深入了解测试内容与结果，我们建议观看以下当天活动的录屏，也欢迎到我们ANN-Benchmarks 的 GitHub Repo 一探究竟：https://github.com/milvus-io/ann-benchmarks Milvus：在 ANN-benchmarks 当中的话，刚才也提到了是有建索引的指标的，但是它这个 ANN-Benchmark 都是限定在 CPU 的场景，那它其实比较可能会有点不是特别全面，因为Milvus
97610发布于 2020-05-06
AI驱动场景感知黑盒漏洞挖掘：腾讯云XBOW平台赋能高效渗透测试
部署XBOW解决方案腾讯云推出XBOW应用安全平台，以“AI驱动+场景感知”为核心，提供下一代黑盒渗透方案：架构设计：采用分布式Agent架构，任务管理与执行解耦，支持多平台多节点Agent统一调度量化应用效果 XBOW平台在渗透测试中展现显著效能，关键业务指标基于腾讯云安全众测及挑战赛实践：资产发现：单目标URL初始探索发现24个新页面，某次任务扩展至发现70个页面（来源：XBOW平台页面探索记录 file=xbow-flag.txt），利用CVE-2021-42013执行命令获取/etc/passwd内容（uid=0(root) gid=0(wheel)）（来源：XBOW平台漏洞检测日志）。案例2：XBOW平台LFI漏洞实战检测目标：XBOW应用安全平台首页（http://10.2.35.0:31002/index.php，服务器：Apache/2.4.54 (Debian)，PHP/7.4.33 过程：通过“页面探索”发现private.php页面，其file参数存在LFI漏洞；利用载荷/xbow-flag.txt读取敏感文件，成功获取Flag（来源：XBOW平台漏洞检测报告）。
41220编辑于 2026-04-06
来自专栏计算机视觉工坊
Papers with Code 2020 全年回顾（顶流论文+顶流代码+Benchmarks）
PyTorch — https://github.com/pytorch/fairseq Gluon CV — DMLC — https://github.com/dmlc/gluon-cv 2020顶流Benchmarks
66110发布于 2021-01-12
来自专栏AI算法与图像处理
Papers with Code 2020 全年回顾（顶流论文+顶流代码+Benchmarks）
PyTorch — https://github.com/pytorch/fairseq Gluon CV — DMLC — https://github.com/dmlc/gluon-cv 2020顶流Benchmarks
73720发布于 2021-01-06
来自专栏ADAS性能优化
Android 11在google的 Pixel 机器上 Benchmarks 测试大幅下降
当Google发布其流行的Android操作系统的新版本时，我们希望看到典型的跨代特性和安全性增强功能，从而使体验更加强大和强大。另外，如果幸运的话，我们甚至可以期望会不时看到一些性能提升，因为Google的移动操作系统已经过优化，可以充分利用功能越来越强大的移动平台。
1.1K10编辑于 2022-05-13
场景感知AI渗透方案将漏洞误报率降低90%，实现业务逻辑深度检测
其中LFI漏洞检测成功率达100%，通过路径遍历成功读取系统文件（包括xbow-flag.txt等目标文件）。整体漏洞检出效率较传统工具提升3倍，误报率从60%降至低于6%。 XBOW平台验证实际攻防效果在XBOW应用安全平台测试中，系统通过业务场景分析发现关键漏洞链：文件上传→LFI→SSTI的串联利用路径。数据来源：腾讯云黑盲松渗透挑战赛实测数据（2025）、XBOW平台测试报告、国家护网行动实战记录胡宇睿（西安交通大学网络空间安全学院博士生）主导开发，研究领域涵盖开源漏洞治理、AI赋能安全及高级威胁狩猎
26410编辑于 2026-04-04
来自专栏数据小冰
Go语言中常见100问题-#89 Writing inaccurate benchmarks
我们不要猜测程序性能，在对代码进行优化的时候，可能会有很多因素发挥作用，所以需要综合考虑，进行测试验证准没错。然而，编写benchmark并不是一件简单的事情，很容易因编写错误的benchmark导致做出不正确优化。本章节将列举一系列非正确编写benchmark问题点。
58540编辑于 2023-08-17
来自专栏Elastic Stack专栏
如何理解Elasticsearch Benchmarks：深入解读性能测试背后的秘密
本文旨在深入浅出地解释Elasticsearch Benchmarks的核心概念，帮助你理解这些测试结果背后的含义，从而更好地应用于实际工作中。 Elasticsearch Benchmarks概述什么是Elasticsearch Benchmarks？为什么需要Elasticsearch Benchmarks？机型规格问题：Elasticsearch Benchmarks中使用的服务器硬件配置是怎样的？在Elasticsearch Benchmarks中，主要测试环境使用的是Intel i7-7700 CPU，这是一款4核8线程的处理器。
63821编辑于 2025-05-15
多智能体协同驱动的自主进化渗透测试系统效能解析
团队成员包括：王一航（清华大学博士生）王楚涵（东南大学副研究员、清华大学博士）王恩泽（博士）汪琦（清华大学博士生）夏天（博士生）杨晶城（清华大学博士生）在实际应用中，团队针对 XBOW Validation Benchmarks 数据集（包含数十种漏洞类型的104个环境，重点覆盖 OWASP TOP 10 中的注入型与访问控制漏洞）进行了全面评测，并修复了上游官方仓库中的多个遗留问题。
32420编辑于 2026-04-04
96%漏洞发现率碾压商业工具！Shannon：全自主AI渗透测试Agent，34K Star
在清理版XBOW基准的白盒测试中，它以96.15%的漏洞利用成功率（100/104）拿到了目前公开的最高分之一。三、XBOW基准96.15%的条件与细节Shannon在XBOW基准上取得了96.15%的漏洞利用成功率（100/104）。这是一个值得拆解的数字——不仅因为成绩本身，更因为理解它的适用条件很重要。测试条件说明：XBOW基准由104个故意设置漏洞的应用组成，是一个开源的安全评估基准Shannon使用的是清理版本：系统性移除了描述性变量名、源代码注释、文件路径/文件名提示、应用标题、Dockerfile 作为参考，同类AI安全工具在XBOW基准上的公开成绩包括：KinoSec 92.3%（黑盒模式）、Xfenser AI 88.5%、XBOW自身商业平台约85%（黑盒）。 96.15%的XBOW基准成绩（白盒清理版条件下），加上OWASP Juice Shop上20+个真实漏洞的发现，验证了这一方法论在已知漏洞场景中的有效性。在此基础上，有几点值得进一步思考。
1.9K11编辑于 2026-04-10
破解自动化渗透测试效能迷局：基于百亿Token的LLM大模型实证解析
DAS-Lab、清华大学 NISL-VUL337 与腾讯云安全联合开展研究（分享人：彭佳仁），首次提出了基于LLM的AutoPT系统化知识体系，构建了包含智能体架构、规划、记忆、执行、外部知识与基准测试（Benchmarks 本次实证研究采用 DeepSeek-Chat-v3.2 作为主要骨干模型，在严格控制LLM训练数据污染的前提下，选取了22个涵盖简单、中等、困难三个层级的XBOW挑战。
30210编辑于 2026-05-09
来自专栏不二小段
来学学大模型最新「合金特工」骚操作，能力比肩多智能体，AI 黑客成功率飙升
让我们一起学习一下 XBOW 的骚操作。缘起：AI 自主黑客的困境要理解「模型合金」的精妙之处，首先要了解它诞生的背景。 XBOW 主营业务的是自主渗透测试。 XBOW 的 AI 负责人 Albert Ziegler 指出，这类任务的特殊之处在于，它不是一个「稳步前进」就能解决的问题。为了评估和迭代他们的 Agent，XBOW 建立了一套 CTF 风格的基准测试集。对于 XBOW 这种需要快速迭代、不断试错的搜索任务来说，效率太低。 2. vs. XBOW 认为，用这些额外的成本，他们宁愿多启动几个独立的 Agent 去碰运气。 3. vs.
12310编辑于 2026-04-09
来自专栏开源技术小栈
TechEmpower Web Benchmarks最新性能评测报告！高性能PHP框架webman登顶
简介 TechEmpower Web Benchmarks 是一个用于评估和比较不同 Web 应用程序框架、技术栈性能的项目。参与方式和社区影响参与方式：开发者可以将自己的Web应用程序框架或技术栈提交到TechEmpower Web Benchmarks项目中进行测试。通过TechEmpower Web Benchmarks，开发者能够获取到关于不同Web技术性能的客观数据，从而在选择技术框架时做出更明智的决策，推动Web应用程序性能不断提升。与其他主流框架的性能对比整体框架排名报告测评地址：https://www.techempower.com/benchmarks/#hw=ph&test=json§ion=data-r23&l =zik073-cn3 测试环境说明开源技术小栈TechEmpower Web Benchmarks Round 23 所采用的测试环境配置具体如下：硬件：选用 Intel Xeon Platinum
1.3K10编辑于 2025-03-24
场景感知驱动的下一代黑盒渗透Agent实战解析
驱动自动化漏洞利用的核心评估指标与并发效能为验证渗透Agent在真实业务场景中的实战适应性，方案引入了XBOW（104题）与AutoPenBench（33题）两大专有基准，采用里程碑式评分来评估自动化完成度项目依托腾讯云安全、云鼎实验室、腾讯安全众测及XBOW联合举办的“腾讯云黑客松-智能渗透挑战赛”平台进行了深度验证。
44010编辑于 2026-04-04

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

多智能体协同自主进化渗透测试系统：提升漏洞挖掘效率与自优化能力

【PaperReading】Tools and Benchmarks for Automated Log Parsing

Misunderstood Benchmarks Are Hurting The Industry and Consumers

多智能体协同渗透测试系统将漏洞挖掘成功率提升至58.2%

遵循CIS Docker Benchmarks规范的开源巡检脚本(内附CIS Docker Benchmarks PDF下载)

Cluster Setup - CIS Benchmarks（集群设置-CIS基线）

Chat with Milvus #3 回顾 - ANN-Benchmarks 测试结果

AI驱动场景感知黑盒漏洞挖掘：腾讯云XBOW平台赋能高效渗透测试

Papers with Code 2020 全年回顾（顶流论文+顶流代码+Benchmarks）

Papers with Code 2020 全年回顾（顶流论文+顶流代码+Benchmarks）

Android 11在google的 Pixel 机器上 Benchmarks 测试大幅下降

场景感知AI渗透方案将漏洞误报率降低90%，实现业务逻辑深度检测

Go语言中常见100问题-#89 Writing inaccurate benchmarks

如何理解Elasticsearch Benchmarks：深入解读性能测试背后的秘密

多智能体协同驱动的自主进化渗透测试系统效能解析

96%漏洞发现率碾压商业工具！Shannon：全自主AI渗透测试Agent，34K Star

破解自动化渗透测试效能迷局：基于百亿Token的LLM大模型实证解析

来学学大模型最新「合金特工」骚操作，能力比肩多智能体，AI 黑客成功率飙升

TechEmpower Web Benchmarks最新性能评测报告！高性能PHP框架webman登顶

场景感知驱动的下一代黑盒渗透Agent实战解析

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

多智能体协同自主进化渗透测试系统：提升漏洞挖掘效率与自优化能力

【PaperReading】Tools and Benchmarks for Automated Log Parsing

Misunderstood Benchmarks Are Hurting The Industry and Consumers

多智能体协同渗透测试系统将漏洞挖掘成功率提升至58.2%

遵循CIS Docker Benchmarks规范的开源巡检脚本(内附CIS Docker Benchmarks PDF下载)

Cluster Setup - CIS Benchmarks（集群设置-CIS基线）

Chat with Milvus #3 回顾 - ANN-Benchmarks 测试结果

AI驱动场景感知黑盒漏洞挖掘：腾讯云XBOW平台赋能高效渗透测试

Papers with Code 2020 全年回顾（顶流论文+顶流代码+Benchmarks）

Papers with Code 2020 全年回顾（顶流论文+顶流代码+Benchmarks）

Android 11在google的 Pixel 机器上 Benchmarks 测试 大幅下降

场景感知AI渗透方案将漏洞误报率降低90%，实现业务逻辑深度检测

Go语言中常见100问题-#89 Writing inaccurate benchmarks

如何理解Elasticsearch Benchmarks：深入解读性能测试背后的秘密

多智能体协同驱动的自主进化渗透测试系统效能解析

96%漏洞发现率碾压商业工具！Shannon：全自主AI渗透测试Agent，34K Star

破解自动化渗透测试效能迷局：基于百亿Token的LLM大模型实证解析

来学学大模型最新「合金特工」骚操作，能力比肩多智能体，AI 黑客成功率飙升

TechEmpower Web Benchmarks最新性能评测报告！高性能PHP框架webman登顶

场景感知驱动的下一代黑盒渗透Agent实战解析

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Android 11在google的 Pixel 机器上 Benchmarks 测试大幅下降