
你有没有过这种崩溃时刻?
想让AI帮你自动抓网页数据、刷热榜、盯股价,结果要么网站根本没公开API,要么写好的爬虫一跑就被验证码拦住,无头浏览器刚启动就被反爬系统识别。
好不容易搞定了鉴权,还要把密密麻麻的DOM树扔给大模型解析,一次操作几万Token没了,账单蹭蹭涨,结果页面一改版,代码全白写。
今天要给大家分享的这个GitHub开源项目bb-browser,用一套完全颠覆传统的思路,把这些难题一次性全解决了。
它的核心理念一句话就能说清:Your browser is the API. No keys. No bots. No scrapers.(你的浏览器,就是最好的API。无需密钥,无需机器人,无需爬虫)
我们平常用的Playwright、Selenium,本质都是「模拟用户」:开一个隔离的无头浏览器,手动搬Cookie、模拟操作,特征明明白白,反爬系统一抓一个准。
传统爬虫就更不用说了,永远在和网站玩「猫鼠游戏」,逆向接口、绕校验、换IP,费时费力,还随时可能失效。
而bb-browser直接跳出了这个死循环——它不模拟用户,它直接让AI成为你。
它通过Chrome开发者工具协议(CDP),直接接管你正在用的、已经登录了各种账号的真实Chrome浏览器。网站收到的每一次请求,本质就是你本人的正常操作,从根源上解决了99%的问题。
一张表看懂核心差距:
特性 | Playwright/Selenium | 传统爬虫库 | bb-browser |
|---|---|---|---|
运行载体 | 隔离的无头浏览器 | 纯请求模拟,无浏览器 | 你正在用的真实Chrome |
登录态复用 | 需手动重登/搬Cookie | 需逆向提取全套令牌 | 直接继承浏览器原生登录态,开箱即用 |
反爬对抗 | 特征明显,极易被检测 | 长期被动内卷 | 无模拟特征,访问主体就是真实用户 |
复杂鉴权适配 | 无法原生复刻,成本极高 | 需完整逆向鉴权逻辑 | 页面原生处理,无需额外适配 |
除此之外,它还有两个无可替代的杀手锏。
传统的AI浏览工具,要把整个页面的DOM树、甚至截图全扔给大模型解析,一次操作几万Token就没了,还特别容易受页面改版影响。
而bb-browser用了「站点适配器」模式,把各大网站的核心功能,直接封装成了一行就能用的CLI命令。
适配器直接在浏览器上下文里调用页面原生接口,返回干净的结构化JSON数据,根本不用大模型解析页面,单次交互Token消耗直接压到几百个,哪怕是本地开源小模型,也能轻松驾驭。
不用你写一行代码,社区已经帮你适配好了11大类、36个主流平台的103个命令,社交、资讯、开发、财经、求职全场景覆盖。
不管是刷知乎热榜、搜X平台帖子、查雪球股价、盯BOSS直聘岗位,还是扒YouTube视频字幕、搜arXiv论文,一行命令就能搞定。
分类 | 覆盖平台 | 核心能力 |
|---|---|---|
搜索 | Google、百度、Bing、DuckDuckGo、搜狗微信 | 全网搜索 |
社交 | Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑 | 搜索、信息流、帖子详情、用户主页、通知、热榜 |
新闻 | BBC、路透社、36氪、今日头条、东方财富 | 头条、搜索、快讯、热榜 |
开发 | GitHub、StackOverflow、HackerNews、CSDN、博客园、V2EX、npm、PyPI、arXiv | 搜索、Issue、仓库详情、热榜、帖子、包信息 |
视频 | YouTube、B站 | 搜索、视频详情、字幕、热门榜、评论、信息流 |
财经 | 雪球、东方财富、雅虎财经 | 股价、热股、信息流、自选股、搜索 |
求职 | BOSS直聘、LinkedIn | 岗位搜索、详情、简历信息 |
知识 | 维基百科、知乎 | 搜索、摘要、热榜、问答详情 |
先确保你的电脑有Node.js 18及以上版本,打开终端,一行命令完成全局安装:
npm install -g bb-browser安装完成后,先拉取最新的社区适配器配置,确保所有命令都能正常用:
bb-browser site update你还可以用bb-browser site recommend,看看和你浏览习惯匹配的适配站点。
如果你是OpenClaw用户,不用装Chrome扩展,不用开后台守护进程,只要在命令后面加个--openclaw参数,就能直接通过OpenClaw内置浏览器运行。
举两个例子:
# 获取Reddit热榜
bb-browser site reddit/hot --openclaw
# 获取雪球前5支热股,只展示股票名和涨跌幅
bb-browser site xueqiu/hot-stock 5 --openclaw --jq '.items[] | {name, changePercent}'不使用OpenClaw的话,装个Chrome扩展就能独立运行,3步就能搞定:
chrome://extensions/,开启右上角「开发者模式」想让Cursor、Claude Code这些支持MCP协议的AI助手,直接用自然语言调用它?只要在MCP配置文件里加一段代码就行:
{
"mcpServers": {
"bb-browser": {
"command": "npx",
"args": ["-y", "bb-browser", "--mcp"]
}
}
}配置完重启一下,AI就能直接调用它的全部能力,你只用说人话,不用记任何命令。
遇到社区没适配的冷门网站也不用慌,bb-browser给你留了完整的底层浏览器操控能力,页面操作、数据抓取、流量监听全覆盖,不用写复杂的XPath,就能精准控制页面。
给大家列几个最常用的:
# 打开指定网页
bb-browser open https://example.com
# 获取纯净的可交互元素树,精准定位页面元素
bb-browser snapshot -i
# 点击指定ID的元素
bb-browser click @3
# 自动填充表单
bb-browser fill @5 "hello world"
# 在页面里执行JS代码
bb-browser eval "document.title"
# 携带页面Cookie发起认证请求
bb-browser fetch URL --json
# 捕获页面完整网络请求和请求体
bb-browser network requests --with-body --json
# 页面截图
bb-browser screenshot所有命令都支持--json格式化输出、--jq数据过滤、--tab多标签并发操作,直接嵌到自动化脚本里也完全没问题。
最绝的是,它的扩展能力几乎没有上限。
项目内置了完整的开发指南,你只要跟AI说一句“帮我把XX网站做成bb-browser的CLI命令”,AI就能自己读指南、抓页面请求、逆向网站接口、写适配代码、做测试,全程不用你动手。
官方给了明确的适配难度分级,哪怕是人工写,最慢10分钟也能搞定一个网站:
适配层级 | 核心逻辑 | 典型平台 | 预估耗时 |
|---|---|---|---|
Tier 1 | Cookie直连,直接fetch | Reddit、GitHub、V2EX | 约1分钟 |
Tier 2 | Bearer+CSRF令牌校验 | X平台、知乎 | 约3分钟 |
Tier 3 | Webpack注入/前端状态库拦截 | 小红书、X平台高级搜索 | 约10分钟 |
官方做过测试:20个AI Agent并行运行,每个都能独立完成网站逆向和适配代码编写。换句话说,AI能访问的网站,边际成本几乎为零。
bb-browser的核心架构采用分层设计,全程在本地运行,不会泄露用户的浏览器数据与登录态,完整调用链路如下:
AI Agent (Claude Code、Cursor等)
↓ CLI / MCP (stdio)
bb-browser CLI ──HTTP──▶ 本地守护进程(Daemon) ──SSE──▶ Chrome扩展
↓ chrome.debugger (CDP协议)
用户的真实Chrome浏览器localhost:19824,支持通过--host参数自定义监听地址,可配置IPv4-only(解决macOS IPv6兼容问题)或全接口监听(适配Tailscale/ZeroTier远程访问场景);有了 bb-browser 之后,AI Agent的世界,是文件、终端,和整个互联网。
它不用再费劲模拟人类的操作,不用再和网站做无休止的反爬对抗,不用再搬运你的登录信息。它可以像你一样,光明正大地访问任何网站,获取任何信息。
这才是AI Agent真正该有的,原生的互联网访问能力。
你最想用这个工具做什么?欢迎在评论区聊聊。