首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >这个 skills 太硬核了,刚开源就斩获 1.7K Star!Agent 联网能力拉满!

这个 skills 太硬核了,刚开源就斩获 1.7K Star!Agent 联网能力拉满!

作者头像
开源星探
发布2026-04-10 08:29:01
发布2026-04-10 08:29:01
1670
举报
文章被收录于专栏:翩翩白衣少年翩翩白衣少年

最近在 AI 开发者圈子里,有一个话题被反复讨论:如何让 AI 助手真正"上网"?

不是简单的搜索一下,而是能够像真人一样操作浏览器、登录账号、完成复杂的交互任务。

Claude Code 其实早就内置了 WebSearch 和 WebFetch 工具,但用过的人都知道,这两个工具局限性太大了。

它们只能做简单的网页获取和搜索,完全无法处理需要登录态、需要复杂交互的场景。

就在大家都在为这些问题头疼的时候,一个叫 web-access 的 skill 横空出世,直接把 Claude Code 的联网和浏览器能力拉满了。

项目简介

web-access 是由开发者 一泽 Eze 开源的一个 Claude Code skill,它的核心理念就是:给 Claude Code 装上完整的联网和浏览器自动化能力

这个 skill 不仅仅是简单地把几个工具拼在一起,而是从底层架构上重新设计了联网策略、浏览器操作和经验积累机制。

它解决了 Claude Code 原本存在的三大短板:

  • • 缺少智能的联网工具调度策略
  • • 没有真正的浏览器自动化能力
  • • 无法积累和复用站点操作经验

有了 web-access 之后,Claude Code 终于可以像真人一样在互联网上自由穿梭了。

核心能力

1、联网工具自动选择

web-access 最大的特点之一就是它的智能工具选择机制。它内置了五层联网通道:

  • WebSearch:用于搜索信息
  • WebFetch:用于获取网页内容
  • curl:用于简单的 HTTP 请求
  • Jina:用于高效的网页内容提取
  • CDP:用于完整的浏览器操作

五层通道,按需组合。最厉害的是,web-access 会根据具体场景自主判断使用哪个工具,甚至可以任意组合多个工具来完成复杂任务。

比如搜索某个产品的最新信息时,它会先用 WebSearch 找到相关链接,再用 WebFetch 或 Jina 获取详细内容,最后如果需要登录态操作,再切换到 CDP 模式。

2、CDP Proxy 浏览器操作

这绝对是 web-access 最硬核的功能。

通过 Chrome DevTools Protocol(CDP),web-access 可以直连你日常使用的 Chrome 浏览器

  • 天然携带登录态:你在 GitHub、🍠、Gmail、X 上登录的账号,web-access 都能直接使用
  • 支持动态页面:JavaScript 渲染的页面、单页应用(SPA)都能完美处理
  • 支持交互操作:点击、输入、滚动、截图都不在话下
  • 支持视频截帧:可以对视频的任意时间点进行截帧分析

再也不用费劲心思去处理 cookie、token 这些登录态问题了,直接用你自己的 Chrome 浏览器就行!

3、三种点击方式

web-access 提供了三种不同的点击方式,每种都有特定的适用场景:

  • /click:使用 JavaScript 进行点击,适合大部分常规场景
  • /clickAt:使用 CDP 真实鼠标事件进行点击,适合那些对点击方式有严格校验的网站
  • /setFiles:专门用于文件上传操作,可以直接指定本地文件路径

这三种方式覆盖了几乎所有网页交互的需求,无论是简单的按钮点击还是复杂的文件上传,都能轻松搞定。

4、并行分治:多任务同时处理,效率翻倍

当你有多个目标需要同时处理时,web-access 会采用并行分治的策略:

  • • 分发多个子 Agent 并行执行任务
  • • 所有子 Agent 共享同一个 CDP Proxy
  • • 每个子 Agent 使用独立的 tab,互不干扰

比如你想同时调研 5 个产品的官网,web-access 可以同时打开 5 个 tab,让 5 个子 Agent 分别去获取信息,最后再汇总成对比摘要。这种效率提升是单线程操作无法比拟的。

5、站点经验积累,越用越聪明

web-access 最有远见的设计就是它的站点经验积累机制:

  • • 按域名存储操作经验
  • • 记录 URL 模式、平台特征、已知陷阱
  • • 跨 session 复用这些经验

6、媒体提取,图片视频一网打尽

web-access 还内置了强大的媒体提取能力:

  • • 从 DOM 中直接提取图片和视频的 URL
  • • 对视频的任意时间点进行截帧分析
  • • 支持各种常见的媒体格式

无论是需要下载页面上的图片,还是需要分析视频中的某个画面,web-access 都能轻松完成。

快速上手

安装方式

web-access 提供了两种安装方式,都非常简单:

方式一:让 Claude 自动安装(推荐) 直接对 Claude 说:"帮我安装这个 skill:https://github.com/eze-is/web-access"

方式二:手动安装

代码语言:javascript
复制
git clone https://github.com/eze-is/web-access ~/.claude/skills/web-access

CDP 模式配置(可选但强烈推荐)

如果你想使用完整的浏览器操作能力,需要配置 CDP 模式:

  1. 1. 环境要求:Node.js 22+
  2. 2. 开启 Chrome 远程调试
    • • 在 Chrome 地址栏打开 chrome://inspect/#remote-debugging
    • • 勾选 "Allow remote debugging for this browser instance"
    • • 可能需要重启浏览器
  3. 3. 运行环境检查
代码语言:javascript
复制
bash ~/.claude/skills/web-access/scripts/check-deps.sh
  1. 4. 启动 CDP Proxy
代码语言:javascript
复制
node ~/.claude/skills/web-access/scripts/cdp-proxy.mjs &

使用示例

安装完成后,你就可以直接让 Claude 执行各种联网任务了,web-access 会自动接管:

简单搜索:"帮我搜索一下 AI 编程助手的最新进展"

读取网页:"读一下这个页面:https://github.com/eze-is/web-access"

多任务并行:"同时调研这 5 个产品的官网,给我对比摘要"

CDP Proxy API 参考

如果你想直接使用 CDP Proxy 的 API,这里有一些常用的示例:

代码语言:javascript
复制
# 新建 tab
curl -s "http://localhost:3456/new?url=https://example.com"

# 执行 JS
curl -s -X POST "http://localhost:3456/eval?target=ID" -d 'document.title'

# JS 点击
curl -s -X POST "http://localhost:3456/click?target=ID" -d 'button.submit'

# 真实鼠标点击
curl -s -X POST "http://localhost:3456/clickAt?target=ID" -d '.upload-btn'

# 文件上传
curl -s -X POST "http://localhost:3456/setFiles?target=ID" \
  -d '{"selector":"input[type=file]","files":["/path/to/file.png"]}'

# 截图
curl -s "http://localhost:3456/screenshot?target=ID&file=/tmp/shot.png"

# 滚动
curl -s "http://localhost:3456/scroll?target=ID&direction=bottom"

# 关闭 tab
curl -s "http://localhost:3456/close?target=ID"
设计哲学

web-access 的作者一泽 Eze 在项目中提到了一个非常有意思的设计哲学:Skill = 哲学 + 技术事实,不是操作手册

这个理念的核心是:不要替 AI 推理,而是讲清楚 tradeoff 让 AI 自己选择。

web-access 不是给 AI 一本操作手册,告诉它"第一步做什么,第二步做什么",而是给它提供一套工具和原则,让它根据具体情况自己做出决策。

这种设计方式让 web-access 具有了极高的通用性和上限。它不是为某个特定场景设计的,而是为所有联网和浏览器操作场景设计的。

写在最后

web-access 的出现,彻底改变了 Claude Code 的能力边界。它不仅仅是一个工具,更是一个让 AI 真正"融入"互联网的桥梁。

这种设计理念让 Skill 更灵活、更智能,也更能适应复杂多变的实际场景。

这个 skill 的潜力巨大,随着版本的不断更新,它的能力还会越来越强。

如果你是一个深度使用 AI 编程助手的用户,可以去试试 web-access,一定会给你带来惊喜。

GitHub:

https://github.com/eze-is/web-access

如果本文对您有帮助,也请帮忙点个 赞👍 + 在看 哈!❤️

在看你就赞赞我!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源星探 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 项目简介
  • 核心能力
  • 快速上手
  • 设计哲学
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档