
GitHub: https://github.com/garrytan/gstack
gstack 是 Garry Tan(Y Combinator 现任 CEO)把 YC 早期 founder 多角色 review 文化编码为 31+ Claude Code slash command skills 的"开源软件工厂",本质是一套用「认知分工」(Cognitive Mode Skills) 把 CEO/Eng/QA/Review 各角色显式拆分的 Agent 工作流方法论。
.gstack/browse.json 跨进程状态、Bun 二进制一键分发。
作者 2026 年 GitHub 贡献图:呈现"vibe coding 全情投入"的视觉叙事

13 年前 YC 内部贡献图:与 2026 形成对照,强化"founder 视角回归"故事
维度 | 数据 |
|---|---|
GitHub | https://github.com/garrytan/gstack |
Star / Fork | 113,209 / 16,799(Watchers 687) |
代码行数 | 161,742(TypeScript 79.3%,YAML/MD 11.2%,Shell 5.7%,JS 2.7%) |
文件数 | 1,037 |
项目年龄 | 3.4 个月(首 commit 2026-03-11,最近 commit 2026-06-21) |
开发阶段 | 密集开发 |
开发模式 | 业余 Side Project(周末提交 36.1%,夜间提交 32.7%) |
贡献模式 | 单人主导(Top 1 贡献者占比 96.1%) |
热度定位 | 大众热门(爆发型增长,单月 195 stars 全部落在 2026-03-23 单日) |
质量评级 | 代码[良好] 文档[优秀] 测试[基本] |
Garry Tan 是 Y Combinator 现任 CEO、17.9 年 GitHub 老兵,2008 年注册账号,早年参与过 Bookface(YC 内部工具)和 Zurb Foundation,bio 只写「Writes software, dreams.」。除了 gstack(113k stars),同期他还推 gbrain(23.8k stars)—— 两个 AI 项目同时位列个人 stars 榜前二,证明这不是一时兴起,而是把"Y Combinator 早期 batch 工作方法"系统性产品化的产物。
Garry Tan 看到的是:当前 Agent 编码工具(Claude Code、Cursor、Codex)默认把 LLM 当成"全能助手"调用,结果暴露五大痛点 —— 字面主义回应(agent 字面执行指令却不真懂意图)、上下文碎片化(每次对话独立,跨 session 记忆丢失)、延迟(CLI 启动 + 反复 prompt)、状态丢失(多步骤流程中间态不持久)、脆弱选择器(CSS 选择器在动态页面上极易失效)。而这些痛点恰好是 YC 早期 founder 日常会遭遇的:他们需要在 CEO/CTO/Eng/QA/Review 之间反复切换,每个角色需要不同的判断模式 —— 而现有 Agent 工具缺乏"角色分工"概念。
作者明确选择了「显式拆分 persona」而非「统一全能 prompt」。一个 /ship 命令触发"Release Engineer"角色,一个 /plan-ceo-review 触发"YC Partner"角色,每个 SKILL.md 都是一份独立 persona 工作流。同时明确不做什么:不绑定单一 AI host(通过 --host 参数支持 Claude/Codex/Cursor/Gemini/OpenClaw/Hermes/Copilot CLI)、不做 IDE 集成(纯 CLI + 文件协议)、不做 SaaS 化(MIT 协议完全开源)。这套哲学实质是把 Unix 工具链思想(小工具组合)应用到 Agent 工作流。
在 Y Combinator 整体图景里,gstack 承担"早期 founder 工具箱"角色 —— 把 YC 多年沉淀的 review 文化、ship 标准、QA 流程系统化,批量武装给 RFS(Request for Startups)阶段的创始人,避免他们在产品方法论上从零摸索。商业化路径不明显,但战略价值高:YC 在 AI Coding 时代的"思想领导力"载体。开源策略是 genuinely open(非 open-core),所有 SKILL.md 都在仓库里,无任何付费墙。
@e1, @e2)标记节点 —— 这解决了动态页面上"按钮位置变了脚本就崩"的经典痛点。任何做 Web 自动化 / E2E 测试 / 爬虫的项目都可迁移,比 Playwright 的 selector 策略更稳定。
.gstack/browse.json) — 新颖度 4/5,实用性 4/5,可迁移性 3/5 browse 守护进程 + 多个 client 之间用 JSON 文件做状态协调,避免引入 Redis/DB 等额外依赖。适合无状态 CLI 工具间需要共享小规模上下文的场景,简单可移植。
bun build --compile 一键二进制分发 — 新颖度 3/5,实用性 5/5,可迁移性 5/5 整套 16 万行的 Claude Code 工作流打包成单文件二进制,用户一行 curl | bash 即可安装。所有想降低分发门槛的 Node/Bun 项目都该考虑 —— Bun 的 native compile 比 npx / npm install 体验好太多。
test:evals(LLM-as-judge)专门评估 prompt 工作流的输出质量 —— 这是 Agent 工作流特有的测试需求。任何把 prompt 视为"代码"严肃对待的团队都该引入这一层。
*/SKILL.md 是一份完整 persona 定义,包含 persona 描述、可用工具、输入输出契约、参考链接。ship/SKILL.md(115 次变更)和 plan-ceo-review/SKILL.md(101 次变更)是最经典的样板。
v1.58.4.0 —— 适合个人项目但不一定适合团队(CHANGELOG 904KB 已经需要拆分归档)。
browse 启动后常驻内存,多个 CLI 调用复用同一浏览器实例,把"启动浏览器延迟"从 5s 降到 <100ms —— 类似 ChromeDriver 但针对 Claude 场景定制。
test/fixtures/(175 次变更)准备标准化输入样本,让 LLM 输出可重复评估,避免 prompt 改动引入回归。
bun build --compile 一键打包 - 问题: Node.js 项目分发门槛高(用户要装 Node + npm + 处理依赖冲突) - 方案: 整套 16 万行 TS 编译成单文件二进制,curl | bash 即可 - Trade-off: 牺牲了跨平台灵活性(需为每个 OS/arch 单独构建)+ 锁定 Bun 生态 - 可迁移性: 高 —— 任何 Bun/Node CLI 项目都该考虑
scripts/resolvers/ 抽象 host-specific 差异,业务 SKILL 写一次即可分发到所有 host - Trade-off: 牺牲了"为单一平台深度优化"的空间,换来"中性平台供应商"地位 - 可迁移性: 高 —— 所有跨平台工具都该有这层抽象
@e1)替代 CSS selector + .gstack/browse.json 持久化跨进程状态 - Trade-off: 牺牲了"按需启动浏览器"的简单性(必须先启动守护进程),换得响应速度和稳定性 - 可迁移性: 中 —— 仅适合需要长会话、复杂交互的自动化场景
browse/src 子项目维持工程化纪律 - Trade-off: 牺牲了长期可维护性,换得平均 2.6 天一版的发版速度 - 可迁移性: 低 —— 仅适合创始人明确、节奏清晰的项目
维度 | gstack | anthropics/skills | PatrickJS/awesome-cursorrules | awesome-claude-code |
|---|---|---|---|---|
形态 | Monorepo + 31+ 完整工作流 | 官方示例 skills 散落 | Cursor 单 IDE 规则集 | 社区导航索引 |
Persona 设计 | 显式拆分 CEO/Eng/QA/Review | 不区分角色 | 单 IDE rule | 无 |
多 host 支持 | Claude/Codex/Cursor/Gemini 等 6+ | 仅 Claude | 仅 Cursor | 索引多样 |
浏览器自动化 | 持久 Chromium + ARIA ref | 无 | 无 | 无 |
测试金字塔 | 静态 + E2E + LLM-as-judge | 无 | 无 | 无 |
分发模式 | 单文件二进制 curl \| bash | npx / git clone | 文件复制 | 链接导航 |
文档化程度 | CLAUDE.md 60KB + ARCHITECTURE 32KB | 简单 README | 各自 README | 索引 README |
Star 数 | 113k | 较少(官方但低调) | ~10k | ~5k |
维护节奏 | 平均 2.6 天一版 | 跟随 Claude Code 版本 | 不定期 | 社区驱动 |
anthropics/skills —— 如果 Anthropic 决定把官方 skills 仓库做得更完整(加入 persona 设计、浏览器自动化、多 host 支持),gstack 的差异化会迅速消失。在整个 AI Coding 工具生态中,gstack 处于"方法论层"(介于 LLM 工具与业务应用之间): - 下方依赖:Anthropic Claude Code CLI / Codex CLI / Cursor 等 host 平台 - 上方服务:YC 系早期 founder、个人 indie hacker、小型技术团队 - 横向对标:continue.dev(IDE 集成层)、aider(CLI 层)、anthropics/skills(官方示例层)
它填补的空白是「把 founder 多角色工作方法论编码为可分发工具」 —— 这在 IDE 厂商和官方示例仓库之间是个明确的真空地带。
bun build --compile —— 任何 Bun/Node CLI 项目都该考虑 5. 三层测试金字塔 —— Agent 项目必加 LLM-as-judge 层/retro skill 在日期锚点错误时静默产生错误输出(issue #1624),下游决策基于错误上下文,提示 skill 编排缺少完善的错误传播机制。browse/src 348 次变更 + 273 次测试变更,是唯一维持工程化纪律的子模块。setup --host claude(默认 host)跑通基础流程,再扩展到 plan-eng-review / ship / qa 这几个最高频的工作流;browse 子系统按需启用ARCHITECTURE.md(32KB)—— 完整架构图解 2. ship/SKILL.md(115 次变更)—— 最经典的 persona 工作流样板 3. plan-ceo-review/SKILL.md(101 次变更)—— "YC Partner" 视角的 review 模式 4. browse/src/ —— 浏览器自动化的实现细节(ARIA ref 系统、守护进程) 5. scripts/resolvers/ —— 多 host 适配层的抽象模式 6. DESIGN.md / ETHOS.md —— 设计哲学与价值观文档browse/src 拆成独立 npm package,允许不依赖 gstack 单独使用 5. 引入 schema validation(zod)校验 SKILL.md frontmatter,避免 #263 类字符超限问题 6. 补齐视觉资产:架构图、demo GIF、CLI 截图资源 | 链接 |
|---|---|
DeepWiki | https://deepwiki.com/garrytan/gstack |
Zread.ai | 未验证(WebFetch 403) |
关联论文 | 无(gstack 是工程方法论/工具集,非学术项目) |
在线 Demo | 无独立 demo 站(依赖本地 Claude Code 环境;DeepWiki 可视为最详细的"架构 demo") |
作者博客 | https://blog.garrytan.com(暂无 gstack 专题文章) |