Y Combinator CEO Garry Tan 的软件工厂 - 让你像 20 人团队一样工作
gstack 是 Y Combinator 总裁 Garry Tan 开发的一套 AI 开发增强工具。它把 Claude Code 变成了一个虚拟工程团队,包含 15 个专业角色:
| 角色 | 技能 | 功能 |
|---|---|---|
| YC 创业顾问 | /office-hours |
六问重构产品,挑战你的假设 |
| CEO | /plan-ceo-review |
找到 10 星产品 |
| 工程经理 | /plan-eng-review |
锁定技术架构 |
| 高级设计师 | /plan-design-review |
设计评审,找 AI 垃圾 |
| 高级工程师 | /review |
自动修 bug,找生产问题 |
| QA 负责人 | /qa |
真实浏览器测试 |
| 发布工程师 | /ship |
一键发布,开 PR |
| 调试专家 | /investigate |
系统化根因调试 |
| 浏览器工程师 | /browse |
真实浏览器交互 |
核心理念:一人一天能写 10,000+ 行生产代码。
确保你已经安装:
- Claude Code
- Git
- Bun v1.0+
步骤 1:克隆到全局技能目录
在 Claude Code 中输入以下命令:
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
步骤 2:配置项目 CLAUDE.md
在你想要使用 gstack 的项目中,在 CLAUDE.md 文件中添加:
## gstack
Use /browse from gstack for all web browsing. Never use mcp__claude-in-chrome__* tools.
Available skills: /office-hours, /plan-ceo-review, /plan-eng-review, /plan-design-review,
/design-consultation, /review, /ship, /browse, /qa, /qa-only, /design-review,
/setup-browser-cookies, /retro, /investigate, /document-release, /codex, /careful,
/freeze, /guard, /unfreeze, /gstack-upgrade.步骤 3:验证安装
在 Claude Code 中输入:
/office-hours
如果看到提示让你描述想要构建的东西,说明安装成功!
/office-hours 是 gstack 的起点,它会挑战你的假设,帮助你找到真正要解决的问题。
你输入:
/office-hours
gstack 问:请描述你想要构建的东西,你真正想解决的是什么痛点?
你回答:
我想做一个每日简报应用,整合我的 Google 日历。
每次查看日程都要打开好多个日历,地点信息经常过期,
准备会议的时间太长,结果还不满意...
gstack 回应(这是真实的输出):
我需要挑战你的想法。你说"每日简报应用",但实际上
你描述的是一个**个人首席助理 AI**。
我发现了你没想到的 5 个能力:
1. 自动纠错过期的会议信息
2. 智能会议准备(资料、议程)
3. 跨平台日历整合
4. 个性化时间优化
5. 实时提醒和跟进
我有 4 个前提需要挑战你:
1. [你同意/不同意/调整]
2. [你同意/不同意/调整]
...
我生成 3 个实现方案:
方案 A:MVP - 基础的每日简报(2 周)
方案 B:完整版 - 首席助理 AI(3 个月)
方案 C:渐进版 - 先 MVP,逐步添加功能
建议:明天先发布最窄的版本,从有效的每日简报开始。
完整的愿景是 3 个月的项目。
- 它不听你说什么,而是听你真正的问题
- 它挑战你的假设,防止过度设计
- 它生成实现方案,让你选择
- 设计文档会自动流入下游技能
什么时候用:当你有新想法时
做什么:
- 问 6 个强制问题重构你的产品
- 挑战你的前提假设
- 生成多个实现方案
- 产出设计文档
案例:
/office-hours
我想做一个 AI 写作助手,帮助用户写营销文案
gstack 会问你:
- 目标用户是谁?
- 解决什么痛点?
- 现有方案有哪些?
- 你的独特优势?
什么时候用:有设计文档后,想从战略角度审视
做什么:
- 阅读设计文档
- 从 CEO/创始人角度重新思考
- 找到 10 星产品
- 四种模式:扩展、选择性扩展、保持范围、缩减
案例:
/plan-ceo-review
它会分析你的设计文档,然后问:
- "这个功能的真正价值是什么?"
- "如果只能做一件事,你会做什么?"
- "这个功能如何配合整体产品战略?"
什么时候用:技术方案设计阶段
做什么:
- 锁定架构和数据流
- ASCII 图表示数据流和状态机
- 边缘情况和失败模式
- 测试矩阵
案例:
/plan-eng-review
它会生成:
┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ Client │────▶│ API │────▶│ Database │
└─────────────┘ └─────────────┘ └─────────────┘
│
▼
┌─────────────┐
│ Cache │
└─────────────┘
什么时候用:代码写完后,PR 审查
做什么:
- 找通过 CI 但会在生产环境爆炸的 bug
- 自动修复明显的问题
- 标记完整性差距
案例:
/review
输出示例:
[AUTO-FIXED] 2 issues:
- 缺少空值检查 in user.ts:23
- 可能的竞态条件 in auth.ts:45
[ASK] Race condition in payment processing
→ 你批准修复吗?
什么时候用:功能开发完成,需要测试
做什么:
- 打开真实浏览器
- 点击通过你的应用流程
- 找到 bug
- 用原子提交修复
- 为每个修复生成回归测试
案例:
/qa https://staging.myapp.com
gstack 会:
- 打开 Chrome 访问 staging
- 模拟用户操作流程
- 发现一个表单验证 bug
- 自动修复并提交
- 生成回归测试防止再次出现
什么时候用:功能完成,准备发布
做什么:
- 同步 main 分支
- 运行测试
- 检查覆盖率
- 推送代码
- 打开 PR
案例:
/ship
输出:
✓ Tests: 42 → 51 (+9 new)
✓ Coverage: 78% → 82%
✓ Pushed to feature-branch
✓ PR: github.com/you/app/pull/42
让我们用 gstack 构建一个 API 监控系统。
你输入:
/office-hours
你回答问题:
- 你想解决什么问题?
- 我的 API 经常超时,但我不知道
- 客户投诉了我才发现问题
- 现有方案有哪些?
- Datadog、Pingdom,但太贵
- 自己写脚本,太简陋
- 你想要的监控系统有什么特别?
- 便宜/免费
- 简单易用
- 支持告警
gstack 输出:
挑战你的前提:
- 你说"便宜",但你对价格敏感度是多少?
- 你说"简单",你的技术团队多大?
生成 3 个方案:
方案 A:开源方案( Grafana + Prometheus)
方案 B:Serverless 方案( AWS Lambda + DynamoDB)
方案 C:托管方案( UptimeRobot 免费版)
建议:从方案 C 开始,明天就能用。
你输入:
/plan-ceo-review
gstack 分析:
这个项目的 10 星版本不只是监控系统,
而是"开发者运维Copilot":
核心价值:
1. 发现问题(监控)
2. 诊断问题(分析)
3. 解决问题(自动化修复)
建议范围:
- 第一周:基础监控 + 告警
- 第二周:日志聚合
- 第三周:自动化修复
你输入:
/plan-eng-review
gstack 生成:
数据流设计:
┌────────────┐ ┌────────────┐ ┌────────────┐
│ Checker │───▶│ Queue │───▶│ Worker │
│ (Cron) │ │ (SQS) │ │ (Lambda) │
└────────────┘ └────────────┘ └────────────┘
│
▼
┌────────────┐
│ Database │
│ (DynamoDB) │
└────────────┘
测试矩阵:
| 场景 | 预期 | 测试覆盖 |
|------|------|----------|
| API 正常 | 200 OK | ✓ |
| API 超时 | 告警触发 | ✓ |
| API 404 | 告警触发 | ✓ |
| 限流 | 重试 + 告警 | ✓ |
你批准计划,退出计划模式,开始写代码。
gstack 会在 8 分钟内生成 2400 行代码,分布在 11 个文件中。
你输入:
/review
gstack 输出:
[AUTO-FIXED] 2 issues:
- 缺少超时处理 in checker.ts:45
- 未捕获异常 in worker.ts:78
[FLAGS] 1 issue:
- 日志级别配置缺失
[COMPLETENESS] Missing tests:
- 限流场景
- 重试场景
你输入:
/qa https://staging.api-monitor.com
gstack 输出:
打开真实浏览器...
测试告警流程...
✓ 邮件告警正常
✓ Slack 告警正常
发现 1 个 bug:
- 告警频率限制未生效
[AUTO-FIXED] 已修复 in config.ts:23
[REGRESSION TEST] 已生成 test/alert-rate-limit.test.ts
你输入:
/ship
gstack 输出:
✓ Synced with main
✓ Tests: 51 → 58 (+7 new)
✓ Coverage: 82% → 85%
✓ Pushed to feature-api-monitor
✓ PR: github.com/you/api-monitor/pull/1
✓ Docs auto-updated
🚀 发布完成!一个完整的功能,
从想法到发布只用了不到 1 小时。
A: 免费!MIT 许可证,完全开源。
A: 运行:
cd ~/.claude/skills/gstack && ./setupA: 可以。全局安装后,在需要的项目中添加 CLAUDE.md 配置即可。
A: 给 AI 一双眼睛。可以在真实浏览器中点击、截图、填表单。适合端到端测试。
A: 输入:
/gstack-upgrade
- 阅读 gstack 完整文档
- 尝试其他技能:
/plan-design-review、/investigate - 了解高级功能:并行 10-15 个 sprint
准备好了?开始你的第一个 /office-hours 吧! 🚀