
当 Y Combinator 的 CEO Garry Tan 在 60 天内写下超过 60 万行生产代码时,他使用的正是 gstack——一个将 Claude Code 转化为虚拟工程团队的开源工具集。
2026 年,Garry Tan 的 GitHub 贡献图显示了一个惊人的数字:1,237 次贡献。而在 2013 年,当他为 YC 构建 Bookface 时,全年的贡献是 772 次。同一个人,不同的时代,差距来自工具。
这不是科幻小说,这是正在发生的现实。gstack 是一个开源的 AI 工程工作流工具集,它让一个人能够以二十人团队的规模进行软件开发。MIT 许可证,完全免费,现在就可以使用。
gstack 是一组 SKILL.md 文件,它们赋予 AI 智能体结构化的角色。每个技能都是一个专家:
15 个专家,6 个强力工具,全部以斜杠命令形式调用,全部是 Markdown。
gstack 不是一个工具集合,而是一个流程。技能按照冲刺的顺序排列:
思考 → 计划 → 构建 → 审查 → 测试 → 发布 → 反思每个技能都为下一个技能提供输入。/office-hours 写的设计文档会被 /plan-ceo-review 读取。/plan-eng-review 写的测试计划会被 /qa 使用。/review 发现的 Bug 会被 /ship 验证修复。没有任何事情会掉进裂缝。
你: 我想构建一个每日简报应用。
你: /office-hours
Claude: [询问痛点 — 具体例子,而非假设]
你: 多个 Google 日历,事件信息过时,地点错误...
Claude: 我要挑战你的框架。你说"每日简报应用",
但你真正描述的是一个个人参谋长 AI。
[提取 5 个你没意识到的能力]
[挑战 4 个前提 — 你可以同意、反对或调整]
[生成 3 个实现方案,附带工作量估算]
你: /plan-ceo-review
[读取设计文档,挑战范围,运行 10 节审查]
你: /plan-eng-review
[ASCII 图表展示数据流、状态机、错误路径]
你: 批准计划。退出计划模式。
[写入 2,400 行代码,跨 11 个文件。约 8 分钟。]
你: /review
[自动修复 2 个问题。标记 1 个竞态条件]
你: /qa https://staging.myapp.com
[打开真实浏览器,点击流程,发现并修复 Bug]
你: /ship
测试: 42 → 51 (+9 新增)。PR: github.com/you/app/pull/42八条命令。这不是副驾驶,这是一个团队。
/office-hours — YC 办公时间从这里开始。六个强制性问题会在你写代码之前重新构建你的产品。它会挑战你的框架,质疑你的前提,生成实现方案。
你说"每日简报应用",它听到你的实际痛点,告诉你你真正在构建的是一个个人参谋长 AI。
/qa — 真实浏览器测试这是最大的突破之一。Claude Code 说"我看到问题了",然后实际修复它,生成回归测试,验证修复——这改变了工作方式。智能体现在有了眼睛。
$B goto https://app.example.com/login
$B snapshot -i # 查看所有可交互元素
$B fill @e3 "test@example.com"
$B fill @e4 "password123"
$B click @e5
$B snapshot -D # 差异显示点击后发生了什么变化
$B screenshot /tmp/result.png/browse — 无头浏览器持久化的无头 Chromium。第一次调用自动启动(约 3 秒),之后每条命令约 100-200ms。状态在调用之间持久保存(Cookie、标签页、会话)。
关键特性:
/ship — 一键发布同步主分支、运行测试、审计覆盖率、推送代码、创建 PR。如果你的项目没有测试框架,它会自动引导一个。
/careful — 安全护栏在执行破坏性命令之前发出警告:rm -rf、DROP TABLE、force-push。说"小心"即可激活。任何警告都可以覆盖。
/freeze — 编辑锁定将文件编辑限制在一个目录内。防止在调试时意外更改范围之外的代码。
/guard — 完整安全模式/careful + /freeze 合二为一。生产环境工作的最大安全保障。
gstack 的核心洞察是:AI 智能体与浏览器交互需要亚秒级延迟和持久状态。
Claude Code gstack
───────── ──────
┌──────────────────────┐
工具调用: $B snapshot -i │ CLI (编译后的二进制) │
─────────────────────────→ │ • 读取状态文件 │
│ • POST /command │
│ 到 localhost:PORT │
└──────────┬───────────┘
│ HTTP
┌──────────▼───────────┐
│ Server (Bun.serve) │
│ • 分发命令 │
│ • 与 Chromium 通信 │
│ • 返回纯文本 │
└──────────┬───────────┘
│ CDP
┌──────────▼───────────┐
│ Chromium (headless) │
│ • 持久化标签页 │
│ • Cookie 保持 │
│ • 30分钟空闲超时 │
└──────────────────────┘bun build --compile 生成单个约 58MB 的可执行文件gstack 在单个冲刺中很强大。在十个同时运行时,它是变革性的。
使用 Conductor 可以并行运行多个 Claude Code 会话——每个在自己的隔离工作空间中。一个会话在新想法上运行 /office-hours,另一个在 PR 上做 /review,第三个实现功能,第四个在预发布环境运行 /qa,还有六个在其他分支上。
冲刺结构是并行工作的关键。 没有流程,十个智能体是十个混乱源。有了流程——思考、计划、构建、审查、测试、发布——每个智能体确切知道做什么和何时停止。
要求: Claude Code、Git、Bun v1.0+
打开 Claude Code 并粘贴:
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup/office-hours — 描述你想构建什么/plan-ceo-review — 对任何功能想法/review — 对任何有变更的分支/qa — 在你的预发布 URL预期在 5 分钟内完成首次有用的运行。
AI 辅助编码使完整性的边际成本接近零。当呈现选项时:
任务类型 | 人类团队 | CC+gstack | 压缩比 |
|---|---|---|---|
样板/脚手架 | 2 天 | 15 分钟 | ~100x |
测试编写 | 1 天 | 15 分钟 | ~50x |
功能实现 | 1 周 | 30 分钟 | ~30x |
Bug 修复 + 回归测试 | 4 小时 | 15 分钟 | ~20x |
架构/设计 | 2 天 | 4 小时 | ~5x |
gstack 包含可选的使用遥测:
gstack-config set telemetry off 立即禁用所有内容这是免费、MIT 许可、开源、现在可用。 没有高级版本,没有等待列表,没有附加条件。
模型正在快速变好。那些现在弄清楚如何与它们合作的人——真正合作,而不仅仅是浅尝辄止——将拥有巨大的优势。这就是那个窗口。
十五个专家和六个强力工具。全部斜杠命令。全部 Markdown。全部免费。
参考链接: