Superpowers 14 个 Skills 全解读：AI 编程纪律框架的完整拆解

最核心的价值不是某个单独 skill，而是这条链路：

需求澄清 → 设计确认 → 计划拆解 → 隔离开发 → TDD → review → 验证 → 收尾

这条链路正好针对 AI coding 最常见的失败模式：过早实现、缺少测试、猜测修复、跳过验证、过早宣布成功。

注意：要经常更新 skills 的代码版本和自己结合实际使用，将自己的经验和要求增加到 skills，以便更好的编程和业务准确性，最好是将自身业务的要求单独作为 skills 引入到编程工具里。

Superpowers 是一个给 AI 编程 Agent 的完整软件开发方法论，由一组可组合 skills 和初始指令组成。它的基本工作流是：先澄清需求、写设计、写实施计划、TDD 实现、代码审查、验证、最后合并/PR/清理。

该不该装？三层判断

层面	判断
技术层面	不必须。没有它，AI coding agent 也能写代码。
工程质量层面	对复杂项目，强烈建议。它强制 TDD、审查、验证，能减少"AI 自信但没验证"的问题。
Superpowers 自身规则层面	一旦安装并启用，它的 `using-superpowers` 明确要求：只要有 1% 可能适用，就必须先调用相关 skill；README 也说这些是 mandatory workflows, not suggestions。

我的建议：重项目安装，轻任务选择性使用；团队协作/生产代码建议默认启用；纯探索、一次性原型可以不用或显式绕开。

1. using-superpowers — 入口规则

这个 skill 不是某个开发动作，而是**"调度所有 skills 的总开关"**。它要求 agent 在任何任务开始前先判断是否有相关 skill；只要有一点可能适用，就要先调用 skill，而不是凭经验直接干。它还规定了优先级：用户明确指令最高，Superpowers skills 其次，默认系统行为最低。

它解决的问题： AI 很容易觉得"这个很简单，不用流程"，然后跳过需求澄清、测试、验证。using-superpowers 专门防这种自我合理化。

适合场景： 每次打开 coding agent；开始任何开发、调试、review、计划任务；防止 agent 忘记用 TDD、debugging、verification 等流程。

是否必须： 如果你安装 Superpowers，这个是事实上的必需入口。不用它，后面的 skills 很容易不会被触发。

我的评价： 它很强硬，但这正是 Superpowers 的核心价值：不是多给 agent 一些建议，而是让 agent 形成"先查流程，再执行"的习惯。

2. brainstorming — 需求澄清和方案设计

它要求在任何创意/功能/行为修改之前，先理解项目上下文、逐个提问、提出 2–3 个方案、分段展示设计并获得用户确认，然后把设计写成 spec 文档，默认保存到 docs/superpowers/specs/YYYY-MM-DD--design.md。它明确禁止在设计获批前写代码或进入实现。

核心流程：

探索项目上下文
必要时提供视觉辅助
一次问一个澄清问题
给出多个方案和权衡
分段展示设计
写设计文档
自检 spec 是否有占位、矛盾、歧义
让用户 review
转入 writing-plans

它解决的问题： AI 还没理解需求就开始写代码；用户以为自己说清楚了，但其实关键约束没说；小需求里隐藏了大架构问题；agent 做了用户并不想要的东西。

是否必须： 对"新功能、行为变化、组件构建、复杂修改"非常值得用。但对极小的机械修改（比如改错别字、重命名变量），可能太重。

我的评价： 这是 Superpowers 最有价值的 skill 之一。它牺牲一点速度，换来更少返工。尤其适合需求不确定、影响面较大的任务。

3. writing-plans — 把设计变成可执行计划

它要求计划足够细，假设执行者不了解代码库、测试品味也不可靠。因此计划必须包含：要改哪些文件、完整代码、测试命令、预期输出、每个任务的 2–5 分钟小步骤、TDD 步骤、频繁 commit。默认保存到 docs/superpowers/plans/YYYY-MM-DD-.md。

关键要求：

每一步都要有具体内容
不能写 TBD、TODO、"添加适当错误处理"这种空话
代码步骤必须给完整代码
测试步骤必须给命令和预期输出
最后要自检 spec 覆盖率、占位符、类型一致性

它解决的问题： "实现这个功能"太宽泛，agent 执行时会乱跑；计划没有文件路径和验证命令，无法可靠交给 subagent；一次做太大，review 困难；没有 TDD 节奏。

是否必须： 如果你要让 agent 做多步开发，强烈建议必须用。如果只是问一个概念、读一段代码，不需要。

我的评价： 这是把 AI coding 从"聊天式开发"变成"任务流水线"的关键。它的计划格式有点啰嗦，但非常适合 subagent 执行。

4. using-git-worktrees — 执行前隔离工作区

核心原则是：先检测是否已经在隔离 workspace；如果没有，优先使用平台原生 worktree 工具；没有原生工具时再用 git worktree。它还要求自动安装依赖、跑 baseline tests，确认起点干净。

它解决的问题： AI 直接在主分支上乱改；当前工作区有用户未提交改动，被 agent 污染；测试一开始就是坏的，后面分不清是原本坏还是 AI 改坏；手动 git worktree 和平台原生隔离机制冲突。

是否必须： 对真实项目开发，尤其是多步实现、PR、实验性改动，建议必须用。对只读分析、解释代码、不改文件，不需要。

我的评价： 这是团队工程里非常实用的 skill。它不提升模型智能，但降低了"AI 把你的工作区搞乱"的风险。

5. subagent-driven-development — subagent 驱动的两阶段 review

适用于已经有 implementation plan，并且任务大多相对独立、希望在当前 session 连续执行的场景。每个任务先派 implementer subagent，然后派 spec reviewer 检查是否符合规格，再派 code quality reviewer 检查质量。它明确说不要在任务之间反复问用户"要继续吗"，除非遇到 blocker、真正的歧义，或者所有任务完成。

核心模式：

每个任务新鲜上下文
implementer 不继承主 session 的全部历史
先 spec compliance review
再 code quality review
reviewer 发现问题必须修复并复审
所有任务完成后进入 finishing-a-development-branch

它解决的问题： 一个长 session 上下文污染，agent 越做越偏；没有 review，错误积累到最后才爆；任务执行者既当开发又当 reviewer；大任务中途频繁打断用户。

是否必须： 如果你的工具支持 subagent，比如 Claude Code 或 Codex 这类有子代理能力的环境，这是 Superpowers 推荐的主执行方式。如果没有 subagent，就用 executing-plans。

我的评价： 这是 Superpowers 最"agentic"的部分。质量更高，但成本也更高，因为每个任务至少 implementer + 两个 reviewer。

6. executing-plans — 无 subagent 时的执行方案

它要求先读取计划、批判性审查计划，有问题先提出来；没问题就创建 todo，然后逐项执行、逐项验证。所有任务完成后必须使用 finishing-a-development-branch。它还提醒：如果有 subagent 支持，应优先用 subagent-driven-development。

它解决的问题： 已经有计划，但 agent 不按计划执行；执行中跳过验证；遇到 blocker 继续猜；做完以后没有正式收尾流程。

是否必须： 当你没有 subagent 能力，但已经有详细 implementation plan 时，应该用它。如果有 subagent，优先用 subagent-driven-development。

我的评价： 它是"低配但稳"的执行方案。没有两阶段 subagent review 那么强，但比无计划执行可靠很多。

7. test-driven-development — 强制 TDD

这是 Superpowers 最硬核的 skill。它的铁律是：没有先失败的测试，就不能写生产代码。如果已经先写了代码，它要求删除并从测试开始。它要求完整 RED-GREEN-REFACTOR：先写失败测试，确认它因为正确原因失败；再写最小实现，确认通过；再重构并保持绿色。

适用范围： 新功能、bugfix、refactor、行为变化。

例外： 一次性原型、生成代码、配置文件。但即便这些例外，也要求问 human partner。

它解决的问题： AI 写了看似正确但没测试的代码；测试后补，结果只测试了实现而不是需求；bugfix 没有回归测试；重构没有安全网。

是否必须： 对生产代码，我建议基本当成必须。对 throwaway prototype 或纯探索，可以显式跳过，但要知道这是牺牲可靠性换速度。

我的评价： 它很教条，但这套教条是故意的。AI coding 最大问题之一就是"产出太快、验证太慢"，TDD skill 正好反过来约束它。

8. systematic-debugging — 先找根因再修

它的铁律是：没有根因调查，不许提出修复方案。流程分四阶段：根因调查、模式分析、假设与测试、实现修复。它特别强调读完整错误信息、稳定复现、检查最近变更、多组件系统加诊断日志、沿调用链追踪坏值来源。

特别重要的一点： 如果连续 3 个修复都失败，它要求停止并质疑架构，而不是继续打补丁。

它解决的问题： "试试这个改动"的随机修 bug；只修症状不修根因；改一个地方坏另一个地方；失败 3 次还继续硬试。

是否必须： 遇到 bug、测试失败、构建失败、性能问题、集成问题时，非常建议必须使用。如果只是解释代码或做设计，不需要。

我的评价： 这是我认为最值得单独拿出来用的 skill。即使你不用整套 Superpowers，也可以学它的调试纪律：复现、证据、假设、最小实验、再修复。

9. verification-before-completion — 完成前必须验证

它的铁律是：没有刚运行过的验证证据，就不能说完成。流程是识别哪个命令能证明这个 claim，运行完整命令，读完整输出和 exit code，然后再根据结果说真实状态。

它解决的问题： AI 说"应该可以了"；agent 相信自己刚改完就是成功；只跑了部分测试就说全部通过；相信 subagent 的 success report，不自己验证；提 PR 前没有跑测试。

是否必须： 对任何"完成/修复/测试通过/构建成功"的声明，应该必须用。这是 trust skill，不是 coding skill。

我的评价： 非常必要。AI 最大的信任问题不是不会写，而是会过早宣布成功。这个 skill 专门限制这件事。

10. requesting-code-review — 主动请求代码审查

它要求用精确上下文派出 code reviewer，而不是把整个 session 历史丢给 reviewer。必须在每个 subagent-driven task 后、重大功能后、merge 前 request review。反馈按 Critical / Important / Minor 处理；Critical 必须立即修，Important 继续前要修。

它解决的问题： agent 自己写自己验；小问题早期没发现，后期变大；reviewer 上下文太多，反而不聚焦；review 只是形式，没有按 severity 处理。

是否必须： 在 Superpowers 主工作流里，任务之间和合并前是必须的。

我的评价： 如果你的环境支持 subagent，非常值得用。没有 subagent 的环境可以退化为让主 agent 做 checklist，但效果会弱很多。

11. receiving-code-review — 收到反馈后先验证再改

它要求先完整阅读反馈，理解并复述或澄清，再检查代码库现实，判断建议是否适合当前代码库，然后逐项实现和测试。它明确禁止 "You're absolutely right!"、"Great point!" 这类表演性回应，也反对没验证就直接实现。

它解决的问题： AI 看到 review 就无脑改；外部 reviewer 不理解上下文，AI 却照做；用户说"fix 1-6"，AI 只理解部分也先改；reviewer 建议"proper implementation"，AI 过度工程化。

是否必须： 当你给 agent review feedback，或者 GitHub/外部 reviewer 给了反馈时，非常建议使用。没有 review feedback 的时候不需要。

我的评价： 这个 skill 很成熟。它把 AI 从"讨好型助手"拉回"工程判断者"。对团队协作很有用。

12. dispatching-parallel-agents — 独立问题并行处理

它适合多个测试文件失败、多个子系统独立损坏、多个 bug 没有共享状态的情况。原则是一个 independent problem domain 一个 agent；不要把"修所有测试"这种宽泛任务丢给一个 agent。

适合场景： 3 个不同测试文件分别失败；多个互不相关的 bug；不同子系统各自有问题；每个问题可以独立理解和修复。

不适合场景： 失败可能同根；需要理解全局状态；agent 会改同一批文件；需要共享状态或顺序依赖。

是否必须： 不必须。它是提速工具，不是基础质量门。但当你有多个独立失败时，很值得用。

我的评价： 这是"加速型 skill"。用对了非常省时间，用错了会制造冲突。关键判断是：这些问题是否真的独立。

13. finishing-a-development-branch — 开发完成后的收尾流程

它要求先跑测试，测试不过就不能进入 merge/PR；然后检测环境是普通 repo、worktree、detached HEAD；确定 base branch；最后给用户结构化选项：本地 merge、创建 PR、保留分支、丢弃。丢弃必须要求用户输入确认。

它解决的问题： 测试没过就合并；做完后不知道是 merge、PR、保留还是丢弃；worktree 清理错误；意外删除分支或工作区；PR 后把仍需迭代的 worktree 清掉。

是否必须： 只要这次任务涉及真实分支/PR/合并，建议必须用。如果只是解释、设计、只读分析，不需要。

我的评价： 非常工程化。它不酷，但能防很多"最后一步翻车"的问题。

14. writing-skills — 创建或修改 skill

它把"写 skill"也当成 TDD：先设计 pressure scenario，让 agent 在没有 skill 的情况下失败；再写最小 skill；再验证 agent 有 skill 后是否遵守；如果发现新漏洞，再修改并复测。它也解释了 skill 的定位：skill 是可复用技术、模式、工具、参考指南，不是一次性经验叙事。

它关心的重点：

skill 的 description 只写触发条件，不总结流程
避免 Claude 只看 description 就偷懒不读正文
用关键词覆盖让 agent 能找到
skill 文档要精简
每个 skill 修改都要测试
不要批量写多个 skill 而不逐个验证

是否必须： 只有你要创建、修改、维护 skills 时才需要。普通使用 Superpowers 不需要它。

我的评价： 这是给框架作者和高级用户用的。普通开发者可以暂时忽略；但如果你想把团队规范沉淀成 AI 可执行流程，它很有价值。

14 个 Skills 的关系图

可以理解成四层：

第一层：入口与规则

using-superpowers：决定什么时候加载其他 skills

第二层：需求到计划

brainstorming：把想法变成设计
writing-plans：把设计变成可执行计划
using-git-worktrees：执行前隔离环境

第三层：执行与质量控制

subagent-driven-development：有 subagent 时的主执行流
executing-plans：无 subagent 或 inline 执行流
test-driven-development：实现时的 TDD 铁律
requesting-code-review：主动请求 review
receiving-code-review：处理 review feedback
dispatching-parallel-agents：独立问题并行处理

第四层：调试、验证、收尾

systematic-debugging：遇到 bug 先找根因
verification-before-completion：完成前必须验证
finishing-a-development-branch：合并/PR/保留/丢弃
writing-skills：扩展或维护 skills

我建议你怎么用

如果你用 Codex / Claude Code 做真实项目

建议完整安装并默认启用。README 明确说不同 harness 需要分别安装；Codex CLI/App、Claude Code、Cursor、Gemini CLI、OpenCode、Copilot CLI 都有对应方式。

如果你是团队使用

建议把它当成"AI 工程规范模板"，但不要盲目接受所有默认强度。可以重点评估：

是否真的要求所有 feature 都 TDD
是否允许小改动跳过 full brainstorming
spec 和 plan 文档保存在哪里
是否强制 worktree
PR 前需要跑哪些测试
review feedback 是否由用户最终裁决

最终判断

Superpowers 不是"必须安装的工具"，而是"值得采用的 AI 编程纪律框架"。

如果你的目标是：快速让 AI 写点东西——那它可能太重。

如果你的目标是：让 AI 更像一个守流程、会测试、会审查、会验证的工程师——那我认为它值得安装，而且应该认真使用。

最核心的价值不是某个单独 skill，而是这条链路：

需求澄清 → 设计确认 → 计划拆解 → 隔离开发 → TDD → review → 验证 → 收尾

这条链路正好针对 AI coding 最常见的失败模式：过早实现、缺少测试、猜测修复、跳过验证、过早宣布成功。

参考：obra/superpowers GitHub 仓库

Superpowers 14 个 Skills 全解读：AI 编程纪律框架的完整拆解#

该不该装？三层判断#

1. using-superpowers — 入口规则#

2. brainstorming — 需求澄清和方案设计#

3. writing-plans — 把设计变成可执行计划#

4. using-git-worktrees — 执行前隔离工作区#

5. subagent-driven-development — subagent 驱动的两阶段 review#

6. executing-plans — 无 subagent 时的执行方案#

7. test-driven-development — 强制 TDD#

8. systematic-debugging — 先找根因再修#

9. verification-before-completion — 完成前必须验证#

10. requesting-code-review — 主动请求代码审查#

11. receiving-code-review — 收到反馈后先验证再改#

12. dispatching-parallel-agents — 独立问题并行处理#

13. finishing-a-development-branch — 开发完成后的收尾流程#

14. writing-skills — 创建或修改 skill#

14 个 Skills 的关系图#

第一层：入口与规则#

第二层：需求到计划#

第三层：执行与质量控制#

第四层：调试、验证、收尾#

我建议你怎么用#

如果你用 Codex / Claude Code 做真实项目#

如果你是团队使用#

最终判断#