首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >终极自动化解决方案:bb-browser 让 AI 接管浏览器

终极自动化解决方案:bb-browser 让 AI 接管浏览器

作者头像
被测试耽误的大厨
发布2026-05-18 15:58:44
发布2026-05-18 15:58:44
1940
举报

你有没有过这种崩溃时刻?

想让AI帮你自动抓网页数据、刷热榜、盯股价,结果要么网站根本没公开API,要么写好的爬虫一跑就被验证码拦住,无头浏览器刚启动就被反爬系统识别。

好不容易搞定了鉴权,还要把密密麻麻的DOM树扔给大模型解析,一次操作几万Token没了,账单蹭蹭涨,结果页面一改版,代码全白写。

今天要给大家分享的这个GitHub开源项目bb-browser,用一套完全颠覆传统的思路,把这些难题一次性全解决了。

它的核心理念一句话就能说清:Your browser is the API. No keys. No bots. No scrapers.(你的浏览器,就是最好的API。无需密钥,无需机器人,无需爬虫)

它和传统工具,根本不是一个维度的东西

我们平常用的Playwright、Selenium,本质都是「模拟用户」:开一个隔离的无头浏览器,手动搬Cookie、模拟操作,特征明明白白,反爬系统一抓一个准。

传统爬虫就更不用说了,永远在和网站玩「猫鼠游戏」,逆向接口、绕校验、换IP,费时费力,还随时可能失效。

而bb-browser直接跳出了这个死循环——它不模拟用户,它直接让AI成为你

它通过Chrome开发者工具协议(CDP),直接接管你正在用的、已经登录了各种账号的真实Chrome浏览器。网站收到的每一次请求,本质就是你本人的正常操作,从根源上解决了99%的问题。

一张表看懂核心差距:

特性

Playwright/Selenium

传统爬虫库

bb-browser

运行载体

隔离的无头浏览器

纯请求模拟,无浏览器

你正在用的真实Chrome

登录态复用

需手动重登/搬Cookie

需逆向提取全套令牌

直接继承浏览器原生登录态,开箱即用

反爬对抗

特征明显,极易被检测

长期被动内卷

无模拟特征,访问主体就是真实用户

复杂鉴权适配

无法原生复刻,成本极高

需完整逆向鉴权逻辑

页面原生处理,无需额外适配

除此之外,它还有两个无可替代的杀手锏。

Token消耗直降99%,小模型也能流畅跑

传统的AI浏览工具,要把整个页面的DOM树、甚至截图全扔给大模型解析,一次操作几万Token就没了,还特别容易受页面改版影响。

而bb-browser用了「站点适配器」模式,把各大网站的核心功能,直接封装成了一行就能用的CLI命令。

适配器直接在浏览器上下文里调用页面原生接口,返回干净的结构化JSON数据,根本不用大模型解析页面,单次交互Token消耗直接压到几百个,哪怕是本地开源小模型,也能轻松驾驭。

开箱即用的庞大生态,主流平台全覆盖

不用你写一行代码,社区已经帮你适配好了11大类、36个主流平台的103个命令,社交、资讯、开发、财经、求职全场景覆盖。

不管是刷知乎热榜、搜X平台帖子、查雪球股价、盯BOSS直聘岗位,还是扒YouTube视频字幕、搜arXiv论文,一行命令就能搞定。

分类

覆盖平台

核心能力

搜索

Google、百度、Bing、DuckDuckGo、搜狗微信

全网搜索

社交

Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑

搜索、信息流、帖子详情、用户主页、通知、热榜

新闻

BBC、路透社、36氪、今日头条、东方财富

头条、搜索、快讯、热榜

开发

GitHub、StackOverflow、HackerNews、CSDN、博客园、V2EX、npm、PyPI、arXiv

搜索、Issue、仓库详情、热榜、帖子、包信息

视频

YouTube、B站

搜索、视频详情、字幕、热门榜、评论、信息流

财经

雪球、东方财富、雅虎财经

股价、热股、信息流、自选股、搜索

求职

BOSS直聘、LinkedIn

岗位搜索、详情、简历信息

知识

维基百科、知乎

搜索、摘要、热榜、问答详情

3分钟上手,3种主流用法全教给你

前置准备

先确保你的电脑有Node.js 18及以上版本,打开终端,一行命令完成全局安装:

代码语言:javascript
复制
npm install -g bb-browser

安装完成后,先拉取最新的社区适配器配置,确保所有命令都能正常用:

代码语言:javascript
复制
bb-browser site update

你还可以用bb-browser site recommend,看看和你浏览习惯匹配的适配站点。

用法一:OpenClaw用户专属,零配置直接用

如果你是OpenClaw用户,不用装Chrome扩展,不用开后台守护进程,只要在命令后面加个--openclaw参数,就能直接通过OpenClaw内置浏览器运行。

举两个例子:

代码语言:javascript
复制
# 获取Reddit热榜
bb-browser site reddit/hot --openclaw

# 获取雪球前5支热股,只展示股票名和涨跌幅
bb-browser site xueqiu/hot-stock 5 --openclaw --jq '.items[] | {name, changePercent}'

用法二:独立使用,Chrome扩展模式

不使用OpenClaw的话,装个Chrome扩展就能独立运行,3步就能搞定:

  1. 1. 从项目Releases页面下载扩展压缩包,完成解压
  2. 2. 打开Chrome,访问chrome://extensions/,开启右上角「开发者模式」
  3. 3. 点击左上角「加载已解压的扩展程序」,选解压后的文件夹就完成了

用法三:对接AI助手,Claude Code/Cursor直接用

想让Cursor、Claude Code这些支持MCP协议的AI助手,直接用自然语言调用它?只要在MCP配置文件里加一段代码就行:

代码语言:javascript
复制
{
  "mcpServers": {
    "bb-browser": {
      "command": "npx",
      "args": ["-y", "bb-browser", "--mcp"]
    }
  }
}

配置完重启一下,AI就能直接调用它的全部能力,你只用说人话,不用记任何命令。

不止开箱即用,还有全功能底层操控能力

遇到社区没适配的冷门网站也不用慌,bb-browser给你留了完整的底层浏览器操控能力,页面操作、数据抓取、流量监听全覆盖,不用写复杂的XPath,就能精准控制页面。

给大家列几个最常用的:

代码语言:javascript
复制
# 打开指定网页
bb-browser open https://example.com

# 获取纯净的可交互元素树,精准定位页面元素
bb-browser snapshot -i

# 点击指定ID的元素
bb-browser click @3

# 自动填充表单
bb-browser fill @5 "hello world"

# 在页面里执行JS代码
bb-browser eval "document.title"

# 携带页面Cookie发起认证请求
bb-browser fetch URL --json

# 捕获页面完整网络请求和请求体
bb-browser network requests --with-body --json

# 页面截图
bb-browser screenshot

所有命令都支持--json格式化输出、--jq数据过滤、--tab多标签并发操作,直接嵌到自动化脚本里也完全没问题。

10分钟适配任意网站,AI能全自动帮你写

最绝的是,它的扩展能力几乎没有上限。

项目内置了完整的开发指南,你只要跟AI说一句“帮我把XX网站做成bb-browser的CLI命令”,AI就能自己读指南、抓页面请求、逆向网站接口、写适配代码、做测试,全程不用你动手。

官方给了明确的适配难度分级,哪怕是人工写,最慢10分钟也能搞定一个网站:

适配层级

核心逻辑

典型平台

预估耗时

Tier 1

Cookie直连,直接fetch

Reddit、GitHub、V2EX

约1分钟

Tier 2

Bearer+CSRF令牌校验

X平台、知乎

约3分钟

Tier 3

Webpack注入/前端状态库拦截

小红书、X平台高级搜索

约10分钟

官方做过测试:20个AI Agent并行运行,每个都能独立完成网站逆向和适配代码编写。换句话说,AI能访问的网站,边际成本几乎为零。

技术架构:安全可控的本地调用链路

bb-browser的核心架构采用分层设计,全程在本地运行,不会泄露用户的浏览器数据与登录态,完整调用链路如下:

代码语言:javascript
复制
AI Agent (Claude Code、Cursor等)
       ↓ CLI / MCP (stdio)
bb-browser CLI ──HTTP──▶ 本地守护进程(Daemon) ──SSE──▶ Chrome扩展
                                              ↓ chrome.debugger (CDP协议)
                                         用户的真实Chrome浏览器
  • • 守护进程默认绑定localhost:19824,支持通过--host参数自定义监听地址,可配置IPv4-only(解决macOS IPv6兼容问题)或全接口监听(适配Tailscale/ZeroTier远程访问场景);
  • • 2026年3月的更新中,守护进程已从WebSocket迁移至Connect-RPC ProviderStream,进一步提升了连接稳定性;
  • • 所有操作均在用户本地浏览器内执行,不会经过第三方服务器,登录态完全保留在浏览器中,无Cookie泄露风险。

最后

有了 bb-browser 之后,AI Agent的世界,是文件、终端,和整个互联网

它不用再费劲模拟人类的操作,不用再和网站做无休止的反爬对抗,不用再搬运你的登录信息。它可以像你一样,光明正大地访问任何网站,获取任何信息。

这才是AI Agent真正该有的,原生的互联网访问能力。

你最想用这个工具做什么?欢迎在评论区聊聊。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 全栈测试开发之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 它和传统工具,根本不是一个维度的东西
    • Token消耗直降99%,小模型也能流畅跑
    • 开箱即用的庞大生态,主流平台全覆盖
  • 3分钟上手,3种主流用法全教给你
    • 前置准备
    • 用法一:OpenClaw用户专属,零配置直接用
    • 用法二:独立使用,Chrome扩展模式
    • 用法三:对接AI助手,Claude Code/Cursor直接用
  • 不止开箱即用,还有全功能底层操控能力
  • 10分钟适配任意网站,AI能全自动帮你写
  • 技术架构:安全可控的本地调用链路
  • 最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档