终极自动化解决方案：bb-browser 让 AI 接管浏览器

被测试耽误的大厨

发布于 2026-05-18 15:58:44

8270

你有没有过这种崩溃时刻？

想让AI帮你自动抓网页数据、刷热榜、盯股价，结果要么网站根本没公开API，要么写好的爬虫一跑就被验证码拦住，无头浏览器刚启动就被反爬系统识别。

好不容易搞定了鉴权，还要把密密麻麻的DOM树扔给大模型解析，一次操作几万Token没了，账单蹭蹭涨，结果页面一改版，代码全白写。

今天要给大家分享的这个GitHub开源项目bb-browser，用一套完全颠覆传统的思路，把这些难题一次性全解决了。

它的核心理念一句话就能说清：Your browser is the API. No keys. No bots. No scrapers.（你的浏览器，就是最好的API。无需密钥，无需机器人，无需爬虫）

它和传统工具，根本不是一个维度的东西

我们平常用的Playwright、Selenium，本质都是「模拟用户」：开一个隔离的无头浏览器，手动搬Cookie、模拟操作，特征明明白白，反爬系统一抓一个准。

传统爬虫就更不用说了，永远在和网站玩「猫鼠游戏」，逆向接口、绕校验、换IP，费时费力，还随时可能失效。

而bb-browser直接跳出了这个死循环——它不模拟用户，它直接让AI成为你。

它通过Chrome开发者工具协议（CDP），直接接管你正在用的、已经登录了各种账号的真实Chrome浏览器。网站收到的每一次请求，本质就是你本人的正常操作，从根源上解决了99%的问题。

一张表看懂核心差距：

特性	Playwright/Selenium	传统爬虫库	bb-browser
运行载体	隔离的无头浏览器	纯请求模拟，无浏览器	你正在用的真实Chrome
登录态复用	需手动重登/搬Cookie	需逆向提取全套令牌	直接继承浏览器原生登录态，开箱即用
反爬对抗	特征明显，极易被检测	长期被动内卷	无模拟特征，访问主体就是真实用户
复杂鉴权适配	无法原生复刻，成本极高	需完整逆向鉴权逻辑	页面原生处理，无需额外适配

除此之外，它还有两个无可替代的杀手锏。

Token消耗直降99%，小模型也能流畅跑

传统的AI浏览工具，要把整个页面的DOM树、甚至截图全扔给大模型解析，一次操作几万Token就没了，还特别容易受页面改版影响。

而bb-browser用了「站点适配器」模式，把各大网站的核心功能，直接封装成了一行就能用的CLI命令。

适配器直接在浏览器上下文里调用页面原生接口，返回干净的结构化JSON数据，根本不用大模型解析页面，单次交互Token消耗直接压到几百个，哪怕是本地开源小模型，也能轻松驾驭。

开箱即用的庞大生态，主流平台全覆盖

不用你写一行代码，社区已经帮你适配好了11大类、36个主流平台的103个命令，社交、资讯、开发、财经、求职全场景覆盖。

不管是刷知乎热榜、搜X平台帖子、查雪球股价、盯BOSS直聘岗位，还是扒YouTube视频字幕、搜arXiv论文，一行命令就能搞定。

分类	覆盖平台	核心能力
搜索	Google、百度、Bing、DuckDuckGo、搜狗微信	全网搜索
社交	Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑	搜索、信息流、帖子详情、用户主页、通知、热榜
新闻	BBC、路透社、36氪、今日头条、东方财富	头条、搜索、快讯、热榜
开发	GitHub、StackOverflow、HackerNews、CSDN、博客园、V2EX、npm、PyPI、arXiv	搜索、Issue、仓库详情、热榜、帖子、包信息
视频	YouTube、B站	搜索、视频详情、字幕、热门榜、评论、信息流
财经	雪球、东方财富、雅虎财经	股价、热股、信息流、自选股、搜索
求职	BOSS直聘、LinkedIn	岗位搜索、详情、简历信息
知识	维基百科、知乎	搜索、摘要、热榜、问答详情

3分钟上手，3种主流用法全教给你

前置准备

先确保你的电脑有Node.js 18及以上版本，打开终端，一行命令完成全局安装：

npm install -g bb-browser

安装完成后，先拉取最新的社区适配器配置，确保所有命令都能正常用：

bb-browser site update

你还可以用bb-browser site recommend，看看和你浏览习惯匹配的适配站点。

用法一：OpenClaw用户专属，零配置直接用

如果你是OpenClaw用户，不用装Chrome扩展，不用开后台守护进程，只要在命令后面加个--openclaw参数，就能直接通过OpenClaw内置浏览器运行。

举两个例子：

# 获取Reddit热榜
bb-browser site reddit/hot --openclaw

# 获取雪球前5支热股，只展示股票名和涨跌幅
bb-browser site xueqiu/hot-stock 5 --openclaw --jq '.items[] | {name, changePercent}'

用法二：独立使用，Chrome扩展模式

不使用OpenClaw的话，装个Chrome扩展就能独立运行，3步就能搞定：

1. 从项目Releases页面下载扩展压缩包，完成解压
2. 打开Chrome，访问chrome://extensions/，开启右上角「开发者模式」
3. 点击左上角「加载已解压的扩展程序」，选解压后的文件夹就完成了

用法三：对接AI助手，Claude Code/Cursor直接用

想让Cursor、Claude Code这些支持MCP协议的AI助手，直接用自然语言调用它？只要在MCP配置文件里加一段代码就行：

{
  "mcpServers": {
    "bb-browser": {
      "command": "npx",
      "args": ["-y", "bb-browser", "--mcp"]
    }
  }
}

配置完重启一下，AI就能直接调用它的全部能力，你只用说人话，不用记任何命令。

不止开箱即用，还有全功能底层操控能力

遇到社区没适配的冷门网站也不用慌，bb-browser给你留了完整的底层浏览器操控能力，页面操作、数据抓取、流量监听全覆盖，不用写复杂的XPath，就能精准控制页面。

给大家列几个最常用的：

# 打开指定网页
bb-browser open https://example.com

# 获取纯净的可交互元素树，精准定位页面元素
bb-browser snapshot -i

# 点击指定ID的元素
bb-browser click @3

# 自动填充表单
bb-browser fill @5 "hello world"

# 在页面里执行JS代码
bb-browser eval "document.title"

# 携带页面Cookie发起认证请求
bb-browser fetch URL --json

# 捕获页面完整网络请求和请求体
bb-browser network requests --with-body --json

# 页面截图
bb-browser screenshot

所有命令都支持--json格式化输出、--jq数据过滤、--tab多标签并发操作，直接嵌到自动化脚本里也完全没问题。

10分钟适配任意网站，AI能全自动帮你写

最绝的是，它的扩展能力几乎没有上限。

项目内置了完整的开发指南，你只要跟AI说一句“帮我把XX网站做成bb-browser的CLI命令”，AI就能自己读指南、抓页面请求、逆向网站接口、写适配代码、做测试，全程不用你动手。

官方给了明确的适配难度分级，哪怕是人工写，最慢10分钟也能搞定一个网站：

适配层级	核心逻辑	典型平台	预估耗时
Tier 1	Cookie直连，直接fetch	Reddit、GitHub、V2EX	约1分钟
Tier 2	Bearer+CSRF令牌校验	X平台、知乎	约3分钟
Tier 3	Webpack注入/前端状态库拦截	小红书、X平台高级搜索	约10分钟

官方做过测试：20个AI Agent并行运行，每个都能独立完成网站逆向和适配代码编写。换句话说，AI能访问的网站，边际成本几乎为零。

技术架构：安全可控的本地调用链路

bb-browser的核心架构采用分层设计，全程在本地运行，不会泄露用户的浏览器数据与登录态，完整调用链路如下：

AI Agent (Claude Code、Cursor等)
       ↓ CLI / MCP (stdio)
bb-browser CLI ──HTTP──▶ 本地守护进程(Daemon) ──SSE──▶ Chrome扩展
                                              ↓ chrome.debugger (CDP协议)
                                         用户的真实Chrome浏览器

• 守护进程默认绑定localhost:19824，支持通过--host参数自定义监听地址，可配置IPv4-only（解决macOS IPv6兼容问题）或全接口监听（适配Tailscale/ZeroTier远程访问场景）；
• 2026年3月的更新中，守护进程已从WebSocket迁移至Connect-RPC ProviderStream，进一步提升了连接稳定性；
• 所有操作均在用户本地浏览器内执行，不会经过第三方服务器，登录态完全保留在浏览器中，无Cookie泄露风险。