真的。
这两天我连着读了好几篇 OpenCLI 的文章。
一开始我以为,又是那种"看起来很牛,装起来很烦,用起来很玄学"的浏览器自动化工具。
结果越看越不对劲。
GitHub 上 12.5k 颗 Star。
79+ 个平台适配器。
零 API 费用。
我发现这玩意儿根本不是在卷"自动化"。

它在补 AI 最缺的那个东西。
是手。不是嘴。
别着急,实操命令在下面,耐心看
为什么今天的 AI,像个聪明的废物?
这话有点重。
但你想想是不是这回事——
你让它写方案,写得飞起。
你让它分析竞品,讲得头头是道。
你让它帮你整理选题,能给你列一堆。
但你一旦让它真正去干活……
说白了。
过去很多 AI,脑子有了。
但手没有。
所以它只能站在旁边给你出主意。
真正搬砖的,还是你。
这就很烦。真的很烦。
再看看opencli 是真牛b啊
兄弟们,直接一条命令,把B站hot扒出来了

OpenCLI 牛在哪?它不重新造浏览器
这是它最聪明的地方。
很多浏览器自动化工具,老想着自己开一个新的浏览器实例。
然后你就开始重复经历那套地狱流程:
登录。鉴权。Cookie。验证码。风控。 页面结构变了再重来。
我都吐了。
而 OpenCLI 不是这么玩的。目前有430个内置命令,覆盖70个平台,后面会迭代的更完善

它的思路是:
你不是已经在 Chrome 里登录好了吗?
那我直接复用你的登录态。
你 Chrome 里登着知乎,它就去知乎拿数据。
你登着 B 站、小红书、微信读书,它就复用这些会话继续操作。
平台看到的,是一个正常用户在操作。
这一下,过去最恶心的那堆问题,直接被绕过去了。
不是"自动化更强了"。
是它终于开始尊重真实用户环境了。
这个味道完全不一样。
它真正打开的,是"登录后的世界"
这个点,我觉得很多人还没反应过来。
AI 能访问公开网页,不稀奇。
真正有价值的信息,很多根本不在公开网页里。
而是在:
这些东西,才是真正贴近你工作流的。
过去 AI 碰不到。
现在 OpenCLI 这套思路一上来,就等于把这扇门踹开了一条缝。

从这一步开始,AI 看到的,不再只是"互联网"。
而是你自己的互联网视角。
这个变化很猛。
和 Playwright MCP 有什么区别?
这个也得说清楚。
Playwright MCP 我当然用过。
它强不强?强。
但它的本质,是让大语言模型实时"看着"页面,一步步判断下一步怎么操作。
既慢,又烧 token,还经常翻车。
尤其一旦流程长一点、页面复杂一点、状态多一点,失败率马上就上来了。
而 OpenCLI 的路子不一样。
它是事先把每个平台的数据接口封装成一条固定命令,执行的时候不经过任何 AI 推理,直接取数,直接返回结构化结果。
打个比方——
Playwright MCP 是让 AI 临场发挥。
OpenCLI 是给 AI 发了一本已经写好的操作手册。
一个灵活,一个稳定。
真要进工作流、跑业务,后者太重要了。
它能干什么?三个真实场景
场景一:每天的信息聚合早报
以前想看知乎、B 站、即刻的热榜汇总,要自己一个个打开。
现在一条命令就能同时拉回来,让 AI 整理成一份早报。
甚至可以设成定时任务,早上八点自动跑,吃早饭的时候直接看结果。
场景二:YouTube 视频字幕一键提取
遇到一个 49 分钟的英文采访,不想坐在那里慢慢看?
直接让 AI 调 OpenCLI 把字幕全抓下来存成 Markdown,然后翻译、提炼要点、生成摘要。
以前要花一小时,现在五分钟搞定。
场景三:公众号文章本地存档
想把公众号的文章存成 Markdown 留档?
以前要手动复制排版,现在一行命令搞定:
opencli weixin download --url 文章链接 --output ./weixin
图片也会一并下载保存到本地。
实操命令速查:装完第一天能干什么
别光看概念,直接上手跑这些命令,五分钟就有感觉。
基本范式:
opencli <平台> <动作> [参数] [--format json]
▍拉热榜
# B 站热门视频
opencli bilibili hot --limit 10
# 知乎热榜
opencli zhihu hot --limit 20
# HackerNews(无需登录,直接跑)
opencli hackernews top --limit 10
# 三个一起拉,输出给 AI 整理早报
opencli bilibili hot -f json && opencli zhihu hot -f json && opencli hackernews top -f json
▍搜索平台内容
# 小红书搜关键词
opencli xiaohongshu search query="AI工具"
# B 站搜视频
opencli bilibili search --keyword "Claude Code" --limit 10
# Twitter/X 搜话题
opencli twitter search "OpenCLI" --limit 15 -f json
▍拿你的私人数据(需提前在 Chrome 登录对应平台)
# B 站观看历史
opencli bilibili history --limit 20 -f json
# Twitter 书签
opencli twitter bookmarks --limit 20 -f json
# 知乎文章下载成 Markdown
opencli zhihu download --url "文章链接" -o ./zhihu
▍存档 & 下载
# 公众号文章转 Markdown 存本地(图片一并保存)
opencli weixin download --url "文章链接" -o ./weixin
# B 站视频下载(依赖 yt-dlp)
opencli bilibili download --bvid "BV号"
# 小红书笔记下载(图片/视频)
opencli xiaohongshu download --url "笔记链接"
# Twitter 媒体下载
opencli twitter download --url "推文链接"
▍发内容(写操作,执行前务必确认好内容)
# 发一条推文
opencli twitter post --text "今天用 OpenCLI 效率翻倍了"
# 小红书发笔记
opencli xiaohongshu publish --title "标题" --content "正文"
# 回复某条推文
opencli twitter reply --url "推文链接" --text "回复内容"
▍浏览器直接操控(高级用法)
不只是读数据,OpenCLI 还能直接操控浏览器页面:
opencli open "https://example.com" # 打开页面
opencli click "按钮选择器" # 点击元素
opencli type "输入框" "内容" # 输入文字
opencli screenshot # 截图
opencli eval "document.title" # 执行 JS
这意味着任何网页上的操作,理论上都可以被脚本化。
▍查看所有支持的命令
opencli list
或者运行诊断确认一切正常:
opencli doctor
直接问你的 Claude / OpenClaw:"帮我用 opencli 查一下 B 站今天的热榜",它会自己选命令、自己跑、自己整理结果给你。
这才是接进 Agent 的正确姿势。
对于跑 Agent 工作流的人,它值钱在哪?
值钱在它不是一个孤立工具。
它是可以被接进 Agent 流水线里的。
比如:
一旦浏览器动作被命令化,整个工作流就活了。
它就不再是:"我问一句,AI 回一句。"
而是:
我下一个任务,AI 去环境里把活干回来。
这个差距,真的不是一点半点。
这是问答时代和 Agent 时代的差距。
更狠的是,它连 Electron 应用那条路都在探
Cursor、Notion、ChatGPT 桌面版……
这些桌面应用,OpenCLI 也在往里面接。

一个 Agent 可以去调另一个 AI 工具。
那整个空间就变了。
不是你在一个窗口里手动切来切去。
而是它们自己串起来干活。
你只负责定目标。
剩下的,让工具链自己跑。
这才像数字分身。
不然顶多算数字玩具。
适合哪三类人?
第一类:内容创作者。
你平时要搜选题、找素材、看热门内容、收集案例,很多重复动作都可以命令化。
第二类:运营和数据整理的人。
以前手动翻页、复制、截图、下载,现在可以批量做,省很多时间。
第三类:AI 工作流玩家。
如果你本来就在折腾 Agent、自动化,那这个工具很值得研究。
它相当于给 AI 多接了一双"能操作网页的手"。
怎么安装?10 分钟搞定
安装共三步,照着做就行。
第一步,装 Node.js(需要 20 以上版本)。
去 nodejs.org 下载 LTS 版本,装完验证:
node -v
# 显示 v20.x.x 就对了
第二步,全局安装 OpenCLI 本体:
npm install -g @jackwener/opencli
装完跑一下,看看有没有命令列表出来:
opencli list
第三步,装 Chrome 扩展做浏览器桥接。
去项目 GitHub Releases 页面下载 opencli-extension.zip,解压后:
chrome://extensions/装完跑一下诊断:
opencli doctor
输出全绿,就能开始用了。
提示:扩展装好后,Chrome 必须保持打开状态,目标平台也要提前在浏览器里登录好。OpenCLI 复用的就是你现有的登录态,不需要额外配置任何账号密码。
为什么这不是一个"小工具",而是一个信号?
因为现在模型本身已经够强了。
真的够强了。
大多数人今天卡住,不是卡在模型不聪明。
而是卡在:模型很聪明,但接不上真实环境。
你会看到一种很荒诞的局面:
AI 写方案,写得飞起。
你自己打开浏览器。你自己搜索。你自己登录。你自己复制。你自己整理。
最后 AI 负责动嘴,你负责动手。
这像话吗?不像。
真正下一阶段应该是:
人类负责定目标。
AI 尽可能多地完成中间执行。
从这个角度看,OpenCLI 补的根本不是"一个命令行工具位"。
它补的是:
AI 从会说,到会做,中间缺的那一段执行力。
这段一旦补上,很多事情的天花板就会被直接抬高。
最后一句话
有人说得很准:
"AI 和你的数字生活之间的最后一公里,已经被填平了。 剩下的,是你想用它做什么的问题。"
以前 AI 会说。
现在它开始会看、会拿、会调、会跑。
再往后它就会越来越像一个真正能替你赚钱、替你提效替你跑流程的数字分身。
不是浏览器该不该自动化的问题。
是——
AI,终于开始真的下场干活了。
如果这篇文章对你有用,转发给同样在折腾 AI 工作流的朋友。