

在上篇文章中,我深度解析了 superpowers 这套 skill,没看过的同学可以点此看下。这两天我又关注到有个叫 gstack 的 skill 也非常火爆,也是一个用于 AI Coding 的 skill,我在深度学习后,发现也是一套非常值得推荐的 skill,接下来我们就先来看下 gstack 是什么?它是如何设计的?文末我也会尝试回答下,同为 AI Coding 的 skill,它和 superpowers 这套 skill 有啥异同!
Gstack 是 Y Combinator(简称 YC)总裁兼 CEO Garry Tan 开源的一套 AI 工程工作流,它将 Claude Code 从一个通用的 AI 助手变成了一整支虚拟工程团队:CEO、产品经理、工程经理、资深设计师、安全专家、QA 工程师、发布工程师……应有尽有。可能有些同学不了解 YC,我这里简单介绍一下:YC 是美国知名的创业孵化公司,曾孵化过许多知名企业,比如 Reddit、Dropbox……YC 也曾进军中国市场,当时陆奇负责中国业务,但可能因为水土不服,一年后便退出了中国市场。不过,这并不影响 YC 在创投领域取得的成就。你也应该感受到这个项目的来头有多大了,虚的说完我们来具体看下这套 skill 是如何设计的。
这套 skill 的设计思路很有意思,它不是基于流程来设计的,而是基于角色来设计的。就像一个真实的创业公司,你需要不同的人来负责不同的事情——产品经理想清楚做什么,工程经理想清楚怎么做,设计师保证美观,QA 保证质量,安全官保证不出事,最后发布工程师负责上线。
Gstack 就是把这个团队角色拆成了一个个 skill,让 AI 分别扮演这些角色。更重要的是,这些角色不是孤立的,而是像真实团队一样有协作流程:从创意到产品,从计划到实现,从测试到发布,最后还有回顾复盘。
我把这个流程画了张图,大家可以直观感受一下:

这套 skill 的设计思路已经很清晰了,它是基于角色设计,把一个完整的工程团队"序列化"成了一套可以按顺序调用的技能。每个角色都有自己的职责和专业视角,当你按顺序调用这些技能时,就相当于一个完整的团队在为你工作。
由于篇幅所限,我没法把所有 skill 都详细介绍一遍。这里依然挑选部分来讲,挑选标准是:看名字不太容易理解用途的,以及比较关键的 skill。至于一些偏开发的 skill,见名知意,我就不再展开;感兴趣的同学可以自行查阅官方 GitHub 文件。
这是整个流程的起点,也是我觉得最有意思的一个 skill。你可以把它理解为 Garry Tan 亲自坐诊的"YC 产品门诊"——它不会顺着你说,反而会质疑你的前提,挑战你的假设。
为什么这个 skill 很重要?
做产品最容易犯的错误就是"解决方案找问题"——你先想到一个功能,然后去给它找用武之地。YC 见过太多创业公司死在这上面了,这个 skill 就是在帮你避免这个坑。
它是怎么工作的?
两种模式:
说白了,这一步就是把"我有个想法"变成"这是一个值得做的产品"。最后生成一份设计文档保存在 ~/.gstack/projects/,这份文档会直接输入给后续的 /plan-ceo-review 和 /plan-eng-review。
有了设计文档之后,就该 CEO 出场了。这个 skill 扮演的是 Garry Tan 本人的角色——站在创始人视角,重新思考问题。
为什么需要 CEO 视角?
普通的 AI 助手会字面执行你的需求:你说"加个照片上传功能",它就给你加个文件选择器。但真正的 CEO 会问一个更重要的问题:这个产品到底是做什么的?
这个 skill 也可以称之为 Brian Chesky 模式——重点不是实现显而易见的需求,而是从用户角度重新思考问题,找到那个不可避免、令人愉悦、甚至有点神奇的版本。
举个真实的例子:
你说:"我要给 Craigslist 风格的列表应用增加卖家照片上传功能"。 普通助手:好的,这就加文件选择器。
/plan-ceo-review:等等,照片上传真的是这个功能吗?真正的需求是不是帮卖家创造一个能卖出去的列表?那我们能不能:
看到了吧?这就是 CEO 视角和普通执行者的区别。它不会只满足于字面需求,而是会问:这个请求背后隐藏的 10 星级产品是什么?
四种模式:
这个 skill 最有意思的地方是,它不会只说"好"或"不好",而是会像真正的 CEO 那样问你:"这真的是用户需要的吗?我们能不能做得更大?或者,我们是不是想得太大了?"每种模式都有清晰的 trade-off,让你做最终决策。
这是 gstack 的"秘密武器"之一——一个真实的 Chromium 浏览器,可以真正打开网页、点击按钮、填写表单、截图。
为什么这个很重要?
以前 AI 说"我测试过了",你可能心里打鼓——它真的打开浏览器看了吗?还是在"幻想"测试结果?很多 AI 工具的"测试"都是基于 DOM 结构的模拟,或者更糟——直接编结果。
有了 /browse,你就能确信:是的,它真的测了。
技术原理:
它是一个编译后的二进制,和持久化 Chromium 守护进程通信,基于 Playwright。第一次调用启动浏览器(~3 秒),之后每次调用 ~100-200ms。浏览器在命令之间保持运行,所以 cookie、标签页、localStorage 都会保留。
关键功能:
/setup-browser-cookies 直接导入举个实际例子:
你想测试登录流程,以前 AI 可能会说"我点击了登录按钮,然后跳转到了 dashboard"。但有了 /browse,它会真的这么做:
# 1. 转到登录页
$B goto <https://app.example.com/login>
# 2. 查看可交互内容
$B snapshot -i
→ [@e1] Email input
→ [@e2] Password input
→ [@e3] Login button
# 3. 使用引用填充表单
$B fill @e1 "test@example.com"
$B fill @e2 "password123"
$B click @e3
# 4. 验证成功
$B snapshot -D # diff 显示点击后发生了什么变化
$B is visible ".dashboard" # 断言仪表板已出现
$B screenshot /tmp/after-login.png甚至碰到验证码也不怕:
Claude:我在登录页碰到验证码了。打开可见 Chrome 你解决一下,弄好告诉我。
> browse handoff "Stuck on CAPTCHA at login page"
你:done
Claude:> browse resume
[浏览器在交接后保留所有状态,resume 之后 AI 能获得你离开位置的新鲜快照]说白了,这就是给 AI 一双真实的眼睛,让它能看到网页、交互测试、截图证据。以前 AI 说"我测过了",你可能半信半疑;现在有了 /browse,你可以完全信任——因为它真的看了。
安全这东西,平时感觉不到,出事就是大事。这个 skill 扮演的是首席安全官的角色,给你做全面的安全审计。
为什么需要这个?
很多开发者(包括我自己)对安全都是"事后诸葛亮"——平时不注意,被黑了才后悔。但安全问题一旦发生,损失往往是巨大的:数据泄露、声誉受损、法律责任……
/cso 就是在你合并代码前,帮你把这些问题找出来。
审计内容:
除此之外,它还会检查:
关键特点:
两种模式:
说白了,这就是你的虚拟首席安全官,在你合并代码前帮你把安全关把好。安全这东西,还是预防为主,别等出事了才后悔。
代码写好了,测试通过了,接下来就是发布。这个 skill 扮演的是发布工程师的角色,帮你一键搞定。
为什么需要这个?
发布这事儿说起来简单,但实际上有一堆琐碎的步骤:同步主分支、解决冲突、运行测试、更新版本、写 changelog、提交、push、创建 PR……每一步都可能出错,而且烦得要死。
作为一个喜欢偷懒的人,我当然不想每次都手动做这些。/ship 就是把这堆琐事自动化,让你一个命令搞定。
自动完成:
测试引导: 如果你没有测试框架,它还会帮你 bootstrap 一个:
评审关口: 创建 PR 前会检查评审就绪看板,如果缺工程评审会问,但不阻止你。每个分支保存决策,不会重复问。
举个例子,你刚写完代码,想发布:
你:/ship
/ship:
Step 1: Pre-flight — on feature branch, 12 uncommitted changes included
Step 2: Merge base branch — git fetch origin main && git merge origin/main
Step 3: Run tests — bun test ✓ (42/42 pass)
Step 3.4: Test Coverage Audit — Tests: 42 → 47 (+5 new)
Step 3.5: Pre-Landing Review — No issues found
Step 4: Version bump — v0.11.17.0 → v0.11.18.0
Step 5: CHANGELOG — auto-generated from git log
Step 5.5: TODOS.md — 2 items marked complete
Step 6: Commit — bisectable chunks (5 commits)
Step 7: Push — git push -u origin feature-branch
Step 8: Create PR — <https://github.com/garrytan/gstack/pull/123>
Step 8.5: Auto-invoke /document-release — docs synced
🎉 PR created: <https://github.com/garrytan/gstack/pull/123>说白了,就是把"我写完了"变成"这就上线了"。以前发布可能需要 10 分钟,现在一个命令 30 秒搞定。作为一个喜欢偷懒的人,这当然深得我心。
一个好的团队会不断反思,这个 skill 就是帮你做这件事的。它会分析你的提交历史、工作模式、代码质量指标。
为什么需要这个?
不知道你有没有这种感觉:一周忙忙碌碌,感觉干了很多事,但周末回想起来,又好像啥都没干成。这时候你就需要数据——不要感觉,要事实。
/retro 就是帮你做这件事的:用数据说话,看看这周到底发生了什么。
分析内容:
团队感知: 它可以识别谁运行的命令,对你自己的工作给出最深处理,然后逐个分解每个贡献者,给出具体的表扬和成长机会。
它会计算各种指标:
举个例子:
周末你想回顾这一周:
你:/retro
/retro:Week of Mar 1: 47 commits (3 contributors), 3.2k LOC, 38% tests, 12 PRs, peak: 10pm | Streak: 47d
## Your Week
32 commits, +2.4k LOC, 41% tests. Peak hours: 9-11pm.
Biggest ship: cookie import system (browser decryption + picker UI).
What you did well: shipped a complete feature with encryption, UI, and
18 unit tests in one focused push...
Where to level up: test ratio dipped to 12% on Wednesday — consider
writing tests before refactoring next time.
## Team Breakdown
### Alice
12 commits focused on app/services/. Every PR under 200 LOC — disciplined.
Praise: Shipped the entire auth middleware rewrite in 3 focused sessions
Opportunity: test ratio at 12% — worth investing before payment gets more complex.
### Bob
3 commits — fixed the N+1 query on dashboard. Small but high-impact.
Praise: That N+1 fix reduced dashboard load from 2s to 200ms
Opportunity: only 1 active day this week — check if blocked on anything.
## Top 3 Team Wins
1. Cookie import system shipped
2. Test coverage improved from 32% to 38%
3. No production incidents
## 3 Things to Improve
1. Wednesday had 5 fix commits in a row — consider reviewing earlier
2. Some PRs were over 500 LOC — try to split more
3. E2E tests only ran once this week
## 3 Habits for Next Week
1. Run /review before creating PRs
2. Split PRs over 300 LOC
3. Run E2E tests at least twice甚至可以跨项目全局回顾:
你:/retro global
/retro:Global Retro: 5 projects, 138 commits, 250k LOC across 5 repos
48 AI sessions | Streak: 52d 🔥
🚀 Your Week: xindoo — Week of Mar 1
╔═══════════════════════════════════════════════════
║
║ 138 commits across 5 projects
║ +24.2k LOC added · 2.1k LOC deleted · 22.1k net
║ 48 AI coding sessions (CC: 35, Codex: 10, Gemini: 3)
║ 52-day shipping streak 🔥
║
║ PROJECTS
║ ───────────────────────────────────────────────────────
║ gstack 47 commits +3.2k LOC solo
║ myapp 52 commits +12.8k LOC team
║ other-project 39 commits +8.2k LOC solo
║
║ SHIP OF THE WEEK
║ Cookie import system — 2,457 lines across 18 files
║
║ TOP WORK
║ • Built /retro global — cross-project retrospective
║ • Shipped cookie import in gstack
║ • Refactored auth middleware in myapp
║
║ Powered by gstack · github.com/garrytan/gstack
╚═══════════════════════════════════════════════════说白了,这就是你的虚拟工程经理,每周给你出一份"团队周报"。不要感觉,要数据——用数据说话,看看这周到底发生了什么,有哪些成长机会。结果还会保存 JSON 快照到 .context/retros/,下次运行能显示趋势。
网上已经曝出不少 AI 误删文件的事件了。如果不对 AI 加以约束,确实很容易出问题。这个 skill 的作用是在你准备进行高风险操作前,先把你拦下来提醒一句。
会警告的操作:
rm -rfDROP TABLEgit push --forcegit reset --hardkubectl delete你可以选择确认继续,也可以选择停下。说白了,这就是给你的"三思而后行"按钮。
调试的时候最烦什么?改着改着这个文件,不小心把那个文件也改了。这个 skill 就是帮你锁定编辑范围的。
功能:
调试的时候,把编辑范围锁定在出问题的模块,就不用担心"误伤"其他代码了。
这是 /careful + /freeze 的组合版,一次性开启所有安全防护。
同时开启:
说白了,就是"最高安全模式"——适合碰生产环境或者调试关键系统的时候用。
用完 /freeze 或 /guard 之后,用这个来解锁编辑限制,恢复可以编辑所有目录的状态。
可以看到,Gstack 与 Superpowers 在设计思路上是完全不同的,前者基于角色设计,而后者基于研发流程设计。
我列了张表格,对比下两者的核心差异:
维度 | Gstack | Superpowers |
|---|---|---|
设计理念 | 基于角色(虚拟工程团队) | 基于流程(研发流程护栏) |
核心类比 | 一个完整的创业公司 | 一套资深团队的"作业指导书" |
适用场景 | 从创意到产品的全流程 | 已有需求的工程化落地 |
角色覆盖 | CEO、产品、工程、设计、QA、安全、发布 | 架构师、开发者、测试、评审 |
流程结构 | Think → Plan → Build → Review → Test → Ship → Reflect | Brainstorm → Plan → Implement → Test → Review → Finish |
关键特色 | 真实浏览器、YC 产品思维、CEO 视角 | TDD、系统化调试、验证前置、反谄媚 |
安全工具 | /careful、/freeze、/guard | 流程本身就是安全护栏 |
创始人视角 | ✅ Garry Tan 的 YC 经验 | ❌ 更偏向工程视角 |
适用阶段 | 从 0 到 1,创意阶段 | 从 1 到 N,工程阶段 |
虽然设计思路不同,但两者有一些核心的共同点:
阅读 Gstack 所有 Skill 的过程中,我也总结出几个有意思的结论:
Gstack 和 superpower 其实不是竞品,更多的时候是相互补齐,Gstack 适合偏向于宏观实现——从创意到产品,从 0 到 1;而 Superpowers 适合实际开发落地——从需求到代码,从 1 到 N。说直白点,一个是老板,一个是底层牛马 [doge]。
不过话说回来,这两个工具其实反映了一个共同的趋势:AI 编程不是"让 AI 替你写代码",而是"让 AI 帮你组建一个团队"。以前你一个人要干产品、开发、测试、发布的活,现在这些角色都有 AI 帮你扮演,你只需要做最终决策。
这也是为什么我觉得 AI 不会取代程序员,但会重新定义程序员的工作方式。未来的程序员,可能更像是一个"团队管理者",而不是一个"搬砖工"。