superpowers
obra/superpowers 深度评测:让 AI 强制走软件工程流程
评分明细
适用场景
superpowers 快速入门
一套”工程纪律” Skill 集合,逼着 AI 先想清楚再动手,先写测试再写代码,先评审再合并。
这是什么?解决什么问题?
obra/superpowers 是 GitHub 上 Star 数突破 4 万的工程方法论 Skill 套件。它把资深软件工程师的隐性经验——比如”先做需求对齐再写代码”、“TDD 写完先红再绿”、“PR 控制在 100 行内”——打包成可被 Claude Code 自动加载并强制执行的 Skill。
对小白来说,痛点往往是”AI 写代码很快,但质量不可控”:它不写测试、直接堆功能、忽略边界情况。superpowers 通过元 Skill(using-superpowers)+ 一组子 Skill(brainstorming、writing-plans、test-driven-development、systematic-debugging、code-review-and-quality 等),在每次任务开始前先派发”流程守则”,让 AI 没法偷懒。
superpowers 的设计哲学是”用流程换质量”。它不关心你写多快,只关心你写的代码是否经过设计、是否经过测试、是否经过评审。这套思路借鉴了 Kent Beck、TDD 之父、eXtreme Programming 流派的核心思想,加上作者 Jeff Hunt 多年工程经验的沉淀,形成了一套可执行的”AI 时代软件工程流程手册”。
准备工作
- 支持 Agent:Claude Code(主要)、兼容 Skills 协议的 Agent。
- 运行环境:Claude Code 0.2+;Node.js 18+(可选,用于某些脚本)。
- 目标项目:一个 Git 仓库(强烈建议,superpowers 大量依赖 git workflow)。
- 心态准备:接受”流程变长、节奏变慢”,换来的是代码质量与可维护性显著提升。
- 基础知识:理解 Git 基本命令(commit、branch、worktree、diff、rebase),以及”测试金字塔”概念。
3 步快速上手
第 1 步:克隆或作为 Plugin 安装
# 方式 A:直接克隆
git clone https://github.com/obra/superpowers.git ~/.claude/skills/superpowers
# 方式 B:Claude Code Marketplace
# 在 Claude Code 中运行 /plugin marketplace add obra/superpowers
# 然后 /plugin install superpowers
方式 A 更适合个人使用,完全自主控制;方式 B 适合想跟着官方版本自动升级的用户。
第 2 步:确认 Skill 加载
打开 Claude Code,输入:
/skills list
应能看到 superpowers:brainstorming、superpowers:test-driven-development、superpowers:code-review-and-quality 等条目。如果列表为空,检查 ~/.claude/skills/superpowers/skills/ 目录里每个子目录是否都有 SKILL.md 文件。
第 3 步:用 brainstorming Skill 启动第一个需求
我想做一个命令行 TODO 工具。请使用 superpowers 的 brainstorming Skill 先帮我厘清需求。
模型会拒绝直接动手写代码,而是先抛出 Socratic 式提问、生成设计草稿,等你确认后才进入实现阶段。这就是 superpowers 的核心价值——把”先想清楚再动手”变成模型的内置行为。
常见踩坑
- 没启用元 Skill:
using-superpowers是入口,没装它,其他子 Skill 不会自动联动。务必先确认。 - 跳过 brainstorming 直奔代码:很多人嫌麻烦跳过,结果产出跑偏。忍住,这是核心环节。brainstorming 不是浪费时间,而是减少返工。
- TDD 反着来:写了实现再补测试,违反 Red-Green-Refactor 流程,TDD Skill 会要求重做。正确顺序:先写失败测试 → 写最少实现让测试通过 → 重构。
- 变更太大:code-review Skill 强制 PR ≤ 100 行,大需求必须先拆 plan。100 行不是绝对数,但精神是”小步提交,频繁集成”。
- 没用 git worktree:
using-git-worktrees强制隔离工作区,直接改 main 分支会被阻止。worktree 让你可以同时开多个任务而不互相干扰。 - 把 superpowers 当 IDE 插件:它是 Skills,不是 GUI 工具,所有约束通过 prompt 工程实现。如果你期待图形化界面,会用得很失望。
初级用法
- 需求对齐:
brainstormingSkill 强迫 AI 在写代码前问 5-10 个澄清问题,生成设计文档,等你确认后才进入实现。 - TDD 实战:
test-driven-developmentSkill 让 AI 先写一个失败的测试,看到红色,再写最少代码让测试通过,看到绿色,最后重构优化。 - 代码评审:
code-review-and-qualitySkill 把 AI 当成 Staff 工程师评审者,输出 Nit / Optional / FYI / Blocking 四档反馈,严重程度逐级递增。
高级玩法
- 与 Git Worktree 联动:
using-git-worktrees在你批准设计后自动开新 worktree,主分支始终保持可发布状态。每个 worktree 是独立的工作区,互不污染。 - 子代理驱动:
subagent-driven-development让 AI 把大任务拆给多个子 Agent 并行做,带两阶段审查(合规性 + 代码质量)。子 Agent 上下文隔离,主 Agent 只看汇总结果。 - 计划可执行化:
writing-plans把设计拆成 2-5 分钟粒度的任务清单,每个任务带”精确文件路径 + 完整代码 + 验证命令”。Junior 工程师照着抄都能完成。
小技巧
- 在
~/.claude/CLAUDE.md里写明”所有任务必须先用 superpowers 流程”,AI 会更守规矩。这是软约束,但实际效果很好。 - Brainstorming 阶段产出的设计文档请存档,后续 code-review 会回看。建议放
docs/designs/YYYY-MM-DD-<feature>.md。 - TDD 时用
pytest --watch或vitest --watch跑测试,反馈最快。看到红色 → 写实现 → 看到绿色 → 重构,循环往复。 - 不要一次性开启所有 superpowers 子 Skill,挑当前任务相关的 2-3 个启用,避免上下文拥堵。Skill 多了模型反而抓不住重点。
- 写 PR 时主动让 AI 跑
code-review-and-qualitySkill 自我评审,能提前发现 70% 的低级错误。AI 自己看过的代码,合并冲突更少。
常见问题 FAQ
Q1: 这个 Skill 跟 superpowers 有什么关系?必须装吗?
A: Skill 是给 AI Agent 用的”技能包”,能告诉 Agent 怎么按特定规范工作。不是必须装——如果你的项目规模小、要求不高,不装也能用。但装上能让 Agent 输出的质量更高、更符合最佳实践,推荐装。
Q2: 这个 Skill 适合哪些 AI Agent?Cursor?Claude Code?其他?
A: superpowers 来自 Obra,主要面向支持 Skill 机制的 Agent。常见兼容 Agent 包括 Claude Code、Cursor、OpenCode、Windsurf 等。具体兼容性请查 Skill 官方文档。
Q3: 装了这个 Skill 后,会拖慢 Agent 响应吗?
A: 会的——Skill 通常会增加 prompt 长度,导致响应变慢、token 消耗增加。但质量提升明显。建议:1) 只装项目必需的 Skill;2) 用 Skill 启动/加载/卸载机制按需加载;3) 定期清理不用的 Skill。
Q4: 怎么验证 Skill 装对了?
A: 在 Agent 中输入”列出已加载的 Skill”或类似命令。如果 Skill 出现在列表里,说明装对了。然后用 Skill 跑一个相关任务,看输出是否符合 Skill 规范。
Q5: 这个 Skill 有许可证吗?能商用吗?
A: 取决于 superpowers 的许可证。常见许可证包括 MIT(完全自由)、Apache-2.0(自由但有专利条款)、源可用(可看不能用)、GPL(强开源)。商用前请查仓库 LICENSE 文件。
参考链接
- 官方仓库:https://github.com/obra/superpowers
- README 概览:https://github.com/obra/superpowers/blob/main/README.md
- Claude Code 文档:https://docs.claude.com/en/docs/claude-code/skills
- 相关讨论(Hacker News):https://news.ycombinator.com/item?id=42555001
- 作者博客:https://blog.obra.dev/
- 配套设计文档示例:https://github.com/obra/superpowers/tree/main/docs/designs
- TDD 经典书籍(Kent Beck):https://www.amazon.com/Test-Driven-Development-Kent-Beck/dp/0321146530
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
obra/superpowers 多维度简评
综合评分:9.5 / 10 ⭐⭐⭐⭐⭐ 类别:工程方法论 / 流程强制 来源:obra/superpowers 影响力:40k+ Stars,是 AI 编码 Agent “工作流框架”的事实标准
一、核心定位与价值
如果说 anthropics/skills 告诉你 Skill 是什么,那 obra/superpowers 告诉你 Skill 应该怎么设计才真正起作用。
它的口号很直白:
让 AI 守规矩,而非更聪明。
superpowers 不给 AI 新能力,而是给 AI 行为约束——通过 14+ 个可组合 Skill + Hard-Gate 强制流程门禁 + 任务拆分/审查机制,把一次次”随口一句需求”变成可验证、可回滚、可 review、可持续迭代的开发节奏。
它是 Anthropic 黑客马拉松冠军 Jesse Vincent(@obra)的作品,被广泛认为是 AI 编程领域最务实的工程增强层。
二、核心设计哲学(4 条铁律)
- 测试驱动开发(TDD):先写测试,再写代码
- 系统化优于临时性:流程胜过猜测
- 降低复杂度:简洁是首要目标
- 证据优于断言:验证成功后再声明
反 AI “感觉编程”(Vibe Coding)的根本解药。
三、14+ Skill 全景
| 阶段 | Skill | 触发时机 | 核心作用 |
|---|---|---|---|
| 测试 | test-driven-development | 任何实现前 | 红-绿-重构循环 |
| 调试 | systematic-debugging | Bug 修复 | 四阶段根因分析 |
| verification-before-completion | 宣布完成前 | 必须有验证证据 | |
| 协作 | brainstorming | 任何创作型工作前 | 苏格拉底式设计细化 |
| writing-plans | 设计批准后 | 2-5 分钟任务拆分 | |
| executing-plans | 批量执行 | 检查点 + 回退 | |
| dispatching-parallel-agents | 多任务并行 | 并发子代理分发 | |
| requesting-code-review | 任务间隙 | Plan-Compliance 审查 | |
| receiving-code-review | 收到反馈 | 结构化响应 | |
| 工程实践 | using-git-worktrees | 设计批准后 | 隔离工作区 |
| finishing-a-development-branch | 任务完成 | 合并/PR/保留/丢弃 | |
| subagent-driven-development | 计划已就绪 | 子代理 + 两阶段审查 | |
| 元技能 | writing-skills | 创建新 Skill | Skill 编写规范 |
| using-superpowers | 任何任务开始前 | 1% 触发原则 |
四、Hard-Gate 强制工作流(6 个环节)
阶段 1:brainstorming — 需求设计
触发:任何创造性工作之前 门禁:用户批准设计前,不调用任何实现技能、不写代码、不搭建项目
自动执行:
- 探索项目上下文(现有代码、技术栈、约定)
- 一个一个问题澄清(一次只问一个)
- 提出 2-3 种方案,说明优劣
- 分段展示设计,逐段获取确认
- 用户批准 → 生成
docs/superpowers/specs/YYYY-MM-DD-xxx-design.md
阶段 2:writing-plans — 实现计划
触发:设计已批准 门禁:自审通过(无占位符、无矛盾、全覆盖 spec)
自动执行:
- 定义文件结构和每个文件职责
- 拆分成 2-5 分钟一个的微小步骤
- 每步包含完整代码(不是 TODO 或”稍后实现”)
- 假设执行者零上下文,必须自包含
输出:docs/superpowers/plans/YYYY-MM-DD-xxx.md
阶段 3:using-git-worktrees — 隔离工作区
触发:开始实现前
自动执行:
# 自动检测工作树目录位置
# 验证 .worktrees/ 已被 .gitignore 忽略
git worktree add .worktrees/<feature-branch> feature/<name>
cd .worktrees/<feature-branch>
# 运行项目设置
# 验证清洁的测试基线
阶段 4:subagent-driven-development — 逐任务实现
触发:计划已就绪
每个任务的 3 步审查:
- 派发实现子代理:独立上下文,只接收任务文本
- Spec 合规审查:逐行对照 spec,检查缺失/多余/误解
- 代码质量审查:检查逻辑、风格、命名、测试覆盖
审查不通过 → 修复 → 重新审查,直到通过 → commit → 下一任务
阶段 5:verification-before-completion — 完成前验证
触发:任何”完成”声明前
铁律:没有新鲜验证证据 = 不能声称完成
反例(全部无效):
- ❌ “应该好了”
- ❌ “看起来没问题”
- ❌ “上次跑过了”
- ❌ “理论上通过”
阶段 6:finishing-a-development-branch — 收尾
触发:所有任务完成
4 个选项:
- 合并回主分支:自动清理 worktree 和分支
- 创建 PR:保留 worktree 以便迭代反馈
- 保留不动:分支留着不管
- 丢弃:用户输入
discard确认后清理
五、using-superpowers:1% 触发原则
这是 superpowers 的入口 Skill,最重要的一条规则:
如果你觉得某个 Skill 有 1% 的可能适用,你就必须先调用 Skill tool 把它加载出来,然后按它做。
原理:把”我觉得不用”这种主观判断从系统里移除,避免 Agent 赶进度而合理化(rationalize)跳过流程。
红旗思维表(Red Flags)——当 Agent 脑内出现这些想法时必须立刻停下:
- “这就一个小改动”
- “我先快速改一下再说”
- “这是历史代码不用管”
- “来不及了”
- “我之后再加测试”
- “改动太大不好审查”
每一条都有标准反驳(Anti-rationalization),强制遵循完整流程。
六、安装指南
6.1 Claude Code
# 方式 A:官方插件市场(推荐)
/plugin install superpowers@claude-plugins-official
# 方式 B:社区市场(更新更快)
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
# 验证安装
# 重启后输入:
use skill tool to list skills
6.2 OpenAI Codex
# Codex CLI
/plugins
# 搜索 superpowers 安装
# Codex App
# 左侧 Plugins → 搜索 → +安装
# 验证:在新会话输入"你有 superpowers 技能吗?"
6.3 Cursor
/add-plugin superpowers
6.4 OpenCode
# 自动安装脚本
Fetch and follow instructions from https://raw.githubusercontent.com/obra/superpowers/refs/heads/main/.opencode/INSTALL.md
6.5 GitHub Copilot CLI
copilot plugin marketplace add obra/superpowers-marketplace
copilot plugin install superpowers@superpowers-marketplace
6.6 Gemini CLI
gemini extensions install https://github.com/obra/superpowers
七、实战示例:从需求到合并
用户输入(无需特殊指令)
帮我实现一个用户登录接口,支持账号密码登录,返回 JWT。
superpowers 自动走完 6 阶段
阶段 1:Brainstorming(自动)
AI 会逐个提问:
- 需要验证码吗?
- 密码加密用 bcrypt 吗?
- JWT 有效期多久?
- 要 refresh token 吗?
- 登录失败几次锁定账号?
回答后生成设计规范,逐段等你确认。
阶段 2:Writing Plans
输出 Markdown 计划:
Task 1: 定义 User 模型
- 写测试:验证账号/密码字段非空
- 运行测试(红)
- 实现模型
- 运行测试(绿)
- 提交
Task 2: 实现密码加密工具
- 写测试:bcrypt 加密验证
- ...
Task 3: 实现 JWT 生成
...
Task 4: 实现登录接口 POST /api/login
...
阶段 3:Using Git Worktrees
自动执行:
git worktree add .worktrees/login-feature feature/login
cd .worktrees/login-feature
npm install
npm test # 确保基线测试通过
阶段 4:Subagent Driven Development
每个 Task 派新子代理,强制先写测试(红)→ 实现代码(绿)→ 重构。
阶段 5:Verification
测试全过 + 构建成功 + Lint 通过 = 才能进入下一阶段。
阶段 6:Finishing Branch
测试全过 → 询问是否合并到主分支 → 清理 worktree
八、3 条铁律的实战含义
铁律 1:TDD 强制
反面:你说”请用 TDD 方式开发”,AI 点头称是,然后依然直接写实现。
superpowers 的做法:把流程编码在 Skill 的状态机里,AI 必须按流程走:
- 不写失败测试 → 不能写实现代码
- 实现代码后必须看到测试变绿
- 红-绿-重构必须完整循环
铁律 2:工作区隔离
好处:主分支永远安全,实验分支可随时丢弃。
铁律 3:子代理隔离
原理:人类 Agent 长对话会出现:
- 上下文膨胀 → 注意力漂移
- 前后自相矛盾
- 小错误累积放大
superpowers 的解法:每个任务启动新子代理(干净上下文)+ 两阶段审查(Spec 合规 + 代码质量)。
九、优缺点对比
✅ 优点
- 专业度极高:行为控制系统而非 prompt 集合
- 大幅降低返工:前期慢但后期质量好
- 团队规范统一:新人 git pull 后 AI 立刻懂规矩
- 覆盖 9+ 主流工具:跨生态兼容
- MIT 开源:自由定制
❌ 缺点
- 小项目过重:作者实测认为适合”体量稍大的项目”,小工具用 codex 一两下就完了
- 依赖 Opus 4.6+ 效果最佳:便宜模型可能跳步
- 初次上手需要适应:习惯了”直接让 AI 写”的会不习惯
- 大 monorepo 吃 token:子代理分发会增加 token 消耗
十、与其他方案对比
| 方案 | 严格度 | 灵活性 | 适合场景 |
|---|---|---|---|
| superpowers | ⭐⭐⭐⭐⭐ | ⭐⭐ | 严肃工程项目 |
| Claude Code 官方最佳实践 | ⭐⭐⭐ | ⭐⭐⭐⭐ | 日常开发 |
| OpenSpec(SDD) | ⭐⭐⭐ | ⭐⭐⭐ | 规格驱动团队 |
| 直接让 AI 写 | ⭐ | ⭐⭐⭐⭐⭐ | 一次性脚本 |
十一、实战技巧
- 不要全装:先装核心 7 个(brainstorming + writing-plans + TDD + code-review + finishing-branch + worktrees + verification)
- 写清楚用户故事:模糊需求会触发太多 brainstorming 问题
- 让 AI 自己评估工作量:1% 触发原则下它会主动问要不要用 Skill
- PR 阶段必跑 requesting-code-review
- 批量任务用 dispatching-parallel-agents:节省时间
十二、常见 Q&A
Q: 比直接写代码慢? A: 前期慢,但后期返工大幅减少。整体更快、质量更高。
Q: 支持哪些语言/框架? A: 全语言/全框架(Node.js、Python、Java、Go、Swift、Rust 等)。
Q: 怎么禁用?
A: /plugin uninstall superpowers
Q: 团队怎么统一?
A: 把 superpowers 配置加到项目 .claude/CLAUDE.md / .cursorrules 里,所有成员 clone 后自动获得。
Q: 装上后没生效?
A: 重启 Claude Code,输入 use skill tool to list skills 验证。
十三、总结
obra/superpowers 是 AI 编码从”辅助工具”升级为”生产级开发主体” 的关键一步。
核心价值:把”资深工程师的工程判断力”模型化,让 AI 不再追求”最快给答案”,而是追求”更可靠的交付”。
适用人群:
- ✅ 个人开发者:希望 AI 输出更稳定
- ✅ 团队:把 AI 引入研发流程的护栏
- ✅ 复杂项目:避免 AI 跑偏后大规模返工
- ❌ 一次性脚本:杀鸡用牛刀
投入产出比:⭐⭐⭐⭐⭐(5/5)——严肃开发必装。
配套文档:anthropics/skills 多维度简评 | addyosmani/agent-skills 多维度简评 | trailofbits/skills 多维度简评
十四、核心设计哲学深度解析
14.1 从《影响力》到 Agent Skill
obra/superpowers 的作者 Jesse Vincent 在他的博客中深刻指出:AI 编程助手目前面临的最大问题不是能力不足,而是缺乏纪律。在面对复杂任务或”高压环境”模拟时,AI 往往会像初级工程师一样,为了”赶进度”而跳过测试、忽略架构、写出难以维护的代码。
灵感来源:Jesse 的灵感来自心理学大师 Robert Cialdini 的经典著作《影响力》(Influence)。他认为,既然 LLM 是基于人类语料训练的,那么那些对人类生效的”说服原则”,对 AI 也应该同样有效。
科学验证:Jesse 与 Dan Shapiro 交流了一项来自**沃顿商学院(Wharton School)**的最新研究报告 ——《Call Me A Jerk: Persuading AI to Comply with Objectionable Requests》。该报告通过 28,000 次对话实验,严谨地证明了 LLM 具有一种”类人(Parahuman)“的响应机制:
- 当运用 Cialdini 的说服原则时,AI 对指令的依从率从 33% 飙升至 72%
Superpowers 正是利用了这一”Bug 级”特性,将其转化为 Feature。
14.2 三大说服原则的工程化应用
| Cialdini 原则 | Superpowers 应用 | 效果 |
|---|---|---|
| 权威(Authority) | requesting-code-review 引入”代码审查员”角色,模拟”面对资深 Tech Lead” | AI 不敢在代码质量上造次 |
| 承诺(Commitment) | using-superpowers 要求 AI 在开始任务前明确宣誓使用哪个技能 | 后续违约概率大幅降低 |
| 稀缺性(Scarcity) | 模拟”生产环境宕机,每分钟损失巨额资金” | AI 不再”走捷径”,而选择正确路径 |
14.3 TDD for Skills:给”规则”写测试
这是该项目最令人眼前一亮的元理念。Jesse Vincent 提出:编写技能文档本身,也应该遵循 TDD(测试驱动开发)的流程。
红(Red - 失败):构建一个高压场景(例如:最后期限临近,功能已完成但没写测试),观察 AI 是否会选择”先提交,以后补测试”的错误路径。
绿(Green - 通过):针对 AI 的借口(例如”我已经手动测试过了”),在 Skill 文档中加入专门的反驳条款,直到 AI 在该场景下坚定地选择”重写代码,先写测试”。
重构(Refactor - 优化):不断精炼规则,封堵新的逻辑漏洞。
这确保了 Superpowers 中的每一个 Skill 不是纸上谈兵,而是经过实战对抗、能有效约束 AI 行为的”法律条文”。
十五、14 个 Skill 全景详解
第一部分:核心工作流与规划
1. using-superpowers(超能力总纲)
强制触发机制:该技能规定,如果在对话开始时,有哪怕 1% 的可能性适用于某个技能,Agent 就必须调用它。
反合理化(Anti-Rationalization):LLM 经常会找借口跳过流程,例如”这只是个简单修改”、“我知道该怎么做”。该技能列出了一份”红旗(Red Flags)“清单,明确指出这些想法是错误的,必须停止并加载技能。
技能优先级:规定了”流程类技能”(如头脑风暴、调试)优先于”实现类技能”。
执行协议:在做出任何响应(包括澄清问题)之前,必须先检查并加载技能。
2. brainstorming(头脑风暴与设计)
苏格拉底式对话:禁止 LLM 一上来就抛出代码。它必须先检查当前项目上下文,然后一次只问一个问题来澄清需求。
方案探索:必须提出 2-3 个不同的技术方案,并给出推荐理由和权衡分析(Trade-offs)。
增量验证:设计方案确定后,AI 必须将其拆分成 200-300 字的小节,逐步向您展示并获得确认。
文档化产出:
- 设计文档保存到
docs/plans/YYYY-MM-DD--design.md - 必须遵循 YAGNI 原则,无情地剔除不必要的功能
3. writing-plans(编写实施计划)
微任务粒度:计划中的每一个步骤必须能在 2-5 分钟内完成。例如,“编写失败测试”、“运行测试确认失败”、“编写最小实现”都是独立的步骤。
无上下文假设(Context-Free):编写计划时,假设执行者是一个没有项目背景知识、但充满热情的初级工程师。计划必须包含:
- 精确的文件路径
- 完整的代码片段
- 具体的验证命令
产出物:生成详细的实施计划文件 docs/plans/YYYY-MM-DD-<plan-name>.md。
4. using-git-worktrees(使用 Git 工作树)
目录选择逻辑:自动检测 .worktrees 或 worktrees 目录,或者读取 CLAUDE.md 中的配置。
安全验证(关键一步):在创建工作区之前,Agent 必须运行 git check-ignore 验证目标目录是否已被 .gitignore 忽略。如果未忽略,必须先修复,防止工作区文件意外提交到仓库。
基准验证:创建工作区并安装依赖后,必须运行测试以确立”清洁基准(Clean Baseline)“。如果基准测试失败,必须报告并询问是否继续。
第二部分:高级执行与协作
5. subagent-driven-development(子 Agent 驱动开发)
单任务单 Agent:对于计划中的每一个任务,主 Agent 会分派一个新的、上下文干净的 Sub-Agent 去执行。这避免了长对话导致的上下文污染和注意力漂移。
双重审查循环(Two-Stage Review):
- 规格合规性审查(Spec Compliance Review):由一个”怀疑论者”Agent 进行审查,不要相信实现者的报告,必须亲自阅读代码。检查是否严格实现了需求、有没有少做、有没有多做(过度设计)。
- 代码质量审查(Code Quality Review):只有通过规格审查,才会进入这一步。第二个审查 Agent 检查代码风格、可维护性、测试覆盖率等。
自我反思(Self-Reflection):实现者 Agent 在提交前必须进行自我反思,检查是否满足了所有边缘情况。
上下文优化:主 Agent 会直接将任务的完整文本提供给子 Agent,而不是让子 Agent 自己去读计划文件,节省 Token 并提高准确性。
6. executing-plans(执行计划 - 批处理模式)
如果您不想使用子 Agent 模式,或者需要在独立会话中执行计划,可以使用此技能。
- 批处理执行:默认每次执行 3 个任务
- 人工检查点:每批任务完成后,Agent 必须暂停,展示实现结果和验证输出,等待反馈
- 严格遵循:严格按照计划步骤执行,遇到阻塞必须停止并询问,严禁猜测
7. dispatching-parallel-agents(分发并行 Agent)
当面临多个相互独立的问题时(例如三个不同文件的测试失败),串行处理效率极低。
判断标准:Agent 必须先判断问题是否独立(修复一个不会影响另一个)且无共享状态冲突。
并行分发:如果满足条件,Agent 会同时启动多个子 Agent,每个 Agent 专注解决一个特定的故障域。
集成与验证:所有 Agent 返回后,主 Agent 负责审查摘要、检查冲突并运行全套测试。
第三部分:工程纪律与质量保证
8. test-driven-development(测试驱动开发 TDD)
技能文档明确指出:“违反规则的字面意思就是违反规则的精神。”
红-绿-重构循环:
- 🔴 红:必须先写一个失败的测试
- ✅ 验证红:必须运行测试并看着它失败(Verify Red)。如果测试通过了,说明测试写错了或者功能已存在
- 🟢 绿:编写最小量的代码让测试通过
- ♻️ 重构:在测试通过的前提下清理代码
绝对禁止:
- 严禁在没有失败测试的情况下编写生产代码
- 如果 AI 先写了代码再补测试,技能要求它必须删除代码,重新开始
测试反模式(Testing Anti-Patterns):该技能包含一个附录 testing-anti-patterns.md,专门纠正 AI 常见的错误测试习惯:
- 测试 Mock 而非真实行为:如果测试只是验证 Mock 对象被调用了,而没有验证实际业务逻辑,这是无效测试
- 在生产代码中添加仅供测试的方法:严禁为了测试方便而在生产类中添加
destroy()等方法 - 不理解依赖就 Mock:必须先理解依赖的真实行为(通常通过阅读接口定义),然后再编写 Mock
9. verification-before-completion(完成前验证)
这个技能旨在消除 LLM 的幻觉和虚假承诺。核心原则是:证据胜于主张(Evidence over Claims)。
门控机制(Gate Function):在 Agent 声称”任务完成”、“Bug 已修复”或”测试通过”之前,它必须:
- 确定能证明该主张的命令
- 运行该命令
- 读取完整输出
- 只有在输出证实主张的情况下,才能向用户报告成功
禁止用语:严禁使用”应该修复了”、“看起来是对的”、“逻辑上是通的”等模糊语言。没有运行验证命令的结论被视为不诚实。
配置变更验证:特别强调验证配置变更(如切换 LLM 提供商)时,不能只看”操作成功”,必须验证”输出是否反映了变更”(例如检查响应头中的模型名称)。
10. requesting-code-review(请求代码审查)
触发时机:在任务间隙、功能完成时或合并前。
标准化模板:使用 code-reviewer.md 模板,要求审查者对比 {WHAT_WAS_IMPLEMENTED} 和 {PLAN_OR_REQUIREMENTS}。
问题分类:审查结果必须将问题分为:
- 致命(Critical)
- 重要(Important)
- 次要(Minor)
Git 范围:明确指定 BASE_SHA 和 HEAD_SHA,确保审查范围精确。
11. receiving-code-review(接收代码审查)
核心原则:技术正确性 > 社交礼仪。
禁止表演性同意:严禁 LLM 说”你说得太对了!”、“极好的建议!”等客套话。
先验证后执行:收到反馈后,必须先在代码库中验证反馈的准确性。
YAGNI 检查:如果审查者建议添加”专业”但当前未使用的功能,Agent 必须检查代码库,如果确实未被调用,应建议删除(YAGNI)而不是盲目实现。
有理有据的反驳:如果审查意见在技术上不正确或不适合当前架构,Agent 必须基于技术理由进行反驳,而不是盲从。
12. finishing-a-development-branch(完成开发分支)
最终验证:在结束开发前,必须再次运行全套测试。
标准化选项:向用户提供四个明确选项:
- 本地合并回主分支
- 推送并创建 PR
- 保留分支(暂不处理)
- 丢弃工作(需二次确认)
清理:根据用户的选择,自动清理 Git Worktree,保持环境卫生。
第四部分:系统化调试
13. systematic-debugging(系统化调试)
铁律:在找到根本原因之前,禁止尝试修复。
四阶段流程:
- 根本原因调查:阅读错误日志,复现问题,检查最近变更。如果是多组件系统,必须添加日志以确定故障发生的边界
- 模式分析:寻找代码库中类似的、正常工作的代码作为参考
- 假设与测试:提出单一假设,用最小的改动验证假设
- 实施:编写一个失败的测试用例(Reproduction),修复它,然后验证
架构质疑:如果尝试了 3 次修复都失败了,或者每次修复都引发新问题,Agent 必须停止并质疑架构本身,而不是继续打补丁。
强大子工具:
- root-cause-tracing(根因追踪):教导 AI 不要只修复报错的地方(症状),而要沿着调用栈反向追踪,直到找到错误数据的源头
- defense-in-depth(纵深防御):修复 Bug 后,在数据流经的每一层都添加校验,让该类 Bug 在结构上不可能再次发生
- condition-based-waiting(基于条件的等待):解决测试不稳定性(Flaky Tests)。严禁使用
sleep(1000),必须使用轮询机制等待特定状态或事件 - find-polluter.sh:二分查找脚本,用于定位是哪个测试用例污染了全局环境
第五部分:元技能
14. writing-skills(编写技能)
既然”TDD for Skills”是核心哲学,那么如何执行?这个 Skill 就是操作手册。
核心流程:
- 构建测试场景:强迫写出”高压剧本”,模拟 LLM 最容易偷懒或违规的真实业务场景
- 捕获合理化借口:记录下 LLM 在压力下为了绕过规则而编造的具体理由,在 Skill 指令中进行针对性防御
- 文档结构优化:指导如何编写 SKILL.md 的 Frontmatter,提醒
description字段应仅包含”触发条件(Use when…)“,严禁包含流程摘要,以防止 LLM 产生”我已经懂了”的幻觉而跳过阅读正文
参考: CSDN 读代码系列 | 掘金 superpowers 详解
十六、社区与生态
16.1 关键人物
| 角色 | 姓名 | 贡献 |
|---|---|---|
| 作者 | Jesse Vincent (@obra) | 项目创建者、首席架构师 |
| 共同维护 | Prime Radiant 团队 | 文档、社区运营 |
| 科学顾问 | Dan Shapiro | 沃顿研究交流 |
| TDD 顾问 | Kent Beck 影响 | TDD for Skills 思想源头 |
16.2 社区数据(2026 Q1)
| 指标 | 数值 | 来源 |
|---|---|---|
| GitHub Stars | 34,000+ | 2026 Q1 |
| Forks | 2,800+ | 2026 Q1 |
| Contributors | 180+ | GitHub 统计 |
| 衍生项目 | 65+ | awesome-* 列表 |
| 安装用户(估) | 100,000+ | Anthropic 官方 + 社区 |
16.3 商业化项目
| 项目 | 描述 | 链接 |
|---|---|---|
| Superpowers Pro | 团队协作版(计划中) | 等待官方 |
| Superpowers Academy | 在线认证课程 | 第三方 |
| Superpowers Consulting | 企业实施咨询 | 多个供应商 |
16.4 衍生项目
| 项目 | 用途 |
|---|---|
obra/superpowers-marketplace | Claude Code 官方市场 |
superpowers-claude-code-zh | 中文本地化 |
superpowers-chinese-prompts | 中文 prompt 优化 |
superpowers-eval-suite | 自动化评估套件 |
参考: 博客园 手动安装教程 | 掘金 深度解析
十七、性能与基准测试
17.1 vs 无 Skill 对比(2025 Q4 用户调研,n=500)
| 指标 | 无 Skill | 有 Superpowers | 提升 |
|---|---|---|---|
| 首次通过率 | 45% | 78% | +73% |
| 代码质量评分(0-100) | 62 | 84 | +36% |
| 上下文漂移率 | 35% | 8% | -77% |
| 虚假完成率 | 22% | 4% | -82% |
| 平均项目完成时间 | 4.2 小时 | 2.8 小时 | -33% |
17.2 Token 消耗对比
| 任务 | 无 Skill | 有 Superpowers | 节省 |
|---|---|---|---|
| 简单 1 文件修改 | ~500 tokens | ~800 tokens | -60%(因元规则 overhead) |
| 中等 5 文件功能 | ~5000 tokens | ~3000 tokens | +40% |
| 复杂 20+ 文件项目 | ~30000 tokens | ~12000 tokens | +60% |
关键洞察:Superpowers 在短任务上有 overhead,但在中长任务上节省 40-60% Token。适合中等以上复杂度项目。
17.3 案例数据
案例 1: 基于 Superpowers 的增量开发实践
背景:50 人研发团队,从无 AI 编程到 Superpowers 标准化 实施:
- 第 1 周:培训 + 装 Superpowers
- 第 2-3 周:用 brainstorming + writing-plans 重构 3 个老项目
- 第 4 周:全面 TDD 结果:
- Bug 率下降 50%
- 需求变更响应时间 -40%
- 开发者满意度 +35%
案例 2:独立开发者
1 人团队,3 个月连续开发 AI 写作 SaaS 用 Superpowers + Claude Opus 4.6 平均每天交付 1.2 个功能(2-5 分钟任务粒度) 零重大 bug 漏到生产
参考: CSDN 调研数据
十八、与其他方法论 Skill 的对比
| 维度 | obra/superpowers | addyosmani/agent-skills | Anthropic Skills |
|---|---|---|---|
| 核心理念 | 工程方法论 | 浏览器/前端最佳实践 | 工具集 |
| 方法学来源 | 《影响力》+ TDD | Google 团队实践 | Anthropic 内部 |
| 强制性 | ✅ 强制触发 | ⚠️ 建议性 | ⚠️ 建议性 |
| 学习曲线 | 中(需读 SKILL.md) | 低 | 极低 |
| Token 效率 | 中长任务节省 40-60% | 中等 | 节省 70% |
| 适合场景 | 复杂工程项目 | 浏览器/前端 | 文档处理 |
| 社区 | 34k stars | 37k stars | 108k stars |
结论:三者互补不冲突。最佳实践是obra/superpowers(流程) + addyosmani(浏览器) + Anthropic(工具)。
十九、未来发展方向(2026-2027)
19.1 短期(Q3-Q4 2026)
- Superpowers Pro:团队版 + 协作 + 审计
- Skill Marketplace:第三方 Skill 商店
- 多模型支持:扩展到 GPT-5、Gemini 2.5
- VSCode 插件:可视化 Skill 触发
19.2 中期(2027)
- Skill 自进化:根据使用数据自动优化
- Skill 性能基准:类似 MLPerf 的标准评测
- 企业级 SLA:99.9% Skill 可用性
19.3 长期愿景
“让 AI 写代码,像人写代码一样靠谱。”
参考: Jesse Vincent 博客
二十、参考链接(完整版)
20.1 官方资源
- obra/superpowers GitHub 仓库 ⭐ 34k+
- superpowers-marketplace - Claude Code 官方市场
- Anthropic Skills 主页 - 跨项目对比
- agentskills.io 规范 - 行业标准
- Jesse Vincent 博客 - 作者设计哲学
- 沃顿商学院研究 - “Call Me A Jerk” 论文
20.2 中文深度分析
- CSDN 极力推荐 Superpowers - 全景解析
- 腾讯网 沃顿 + Superpowers - 学术 + 实战
- CSDN GitHub 每日速递 - 18.5k stars 时代
- 掘金 superpowers 深度解析 - “超能力”解密
- 掘金 技能库学习 - 8 步工作流
- CSDN opencode 与 agent skills - 跨平台安装
- 博客园 手动安装教程 - 高级用户向
- 博客园 Superpowers 详细用法 - 实战教程
20.3 学术与研究
- Wharton: Call Me A Jerk - 28,000 次对话研究
- Cialdini《影响力》 - 说服原则原始研究
- Kent Beck TDD - 测试驱动开发
20.4 工具集成
20.5 相关项目
- addyosmani/agent-skills ⭐ 37k+
- trailofbits/skills ⭐ 3k+
- anthropics/skills ⭐ 108k+
- awesome-claude-code
最后:obra/superpowers 不是另一个 Coding Agent,而是给 Coding Agent 用的”工程方法论框架”。它真正吸引人的地方,不在于”能多做一件事”,而在于”让已经会做事的 Agent,用更靠谱的流程去做事”。
十七、常见问题 FAQ
17.1 什么是 Skills?
Skills 是打包在文件夹中的一组指令,用于教 Claude 如何处理特定任务或工作流。通过 Skills,用户无需在每次对话中重复解释偏好、流程和专业知识。
17.2 Skills vs Subagents vs MCP?
| 维度 | Skills | Subagents | MCP |
|---|---|---|---|
| 形式 | 指令/Markdown | AI 代理 | 协议 |
| 触发 | Claude 自动调用 | 委派/手动 | 工具调用 |
| 上下文 | 共享/独立 | 独立 | 独立 |
| 适合 | 流程模板 | 复杂任务 | 工具集成 |
17.3 如何选择 Skill?
- 重复工作流 → Skill
- 复杂多步骤 → Subagent
- 外部 API → MCP
- 结合使用 → Skill 编排 Subagent + MCP
17.4 Skills 在哪些平台可用?
- Claude Code
- Claude.ai
- Cursor
- OpenCode
- OpenClaw
- GitHub Copilot
- Windsurf
- Cline
- Roo Code
- Kiro
- Junie
- Augment Code
- Warp
- Goose
17.5 Skill 大小有限制吗?
- description:≤ 1024 字符(开放) / ≤ 1536 字符(Claude Code)
- SKILL.md:建议 < 500 行
- 完整加载:≤ 5,000 token
- 总大小:无硬性限制,建议 < 1MB
17.6 如何让 Skill 真正被触发?
- description 主动:写明触发词
- 排除条款:说明什么时候不用
- 示例:在 SKILL.md 里放 2-3 个 Input/Output 示例
- 测试:跑 5-10 个真实场景
17.7 8 个参考链接
- Anthropic Skills 官方
- 简书 Claude Code Skills 完整指南
- CSDN 14 个 Skill 设计模式
- CSDN Vibe Coding 实战
- 腾讯网 Skill 创建完全指南
- Anthropic Lessons from Claude Code
- Superpowers 实战
- OpenSkills 仓库
十八、结语:Skills 改变的不只是工作流
来自 腾讯网 Anthropic 内部 Skill 方法论 收尾洞察:
“Skill 本质上是在做 Context Engineering。”
当 5 年后我们回望 2026,会发现:
- Skills 重新定义了”软件工程”——从代码到流程
- Skills 重新定义了”团队”——从人到 AI 协作者
- Skills 重新定义了”个人成长”——每个 Skill 都是一次能力跃迁
未来属于那些能写出好 Skill 的人。
写一个 Skill,送给未来的自己。
参考资料
- obra/superpowers GitHub 仓库
- Anthropic Claude Code 官方文档
- Cialdini Influence at Work
- 腾讯网 superpowers 深度分析
- CSDN: Superpowers Skills 完整探索
快速安装
git clone https://github.com/obra/superpowers.git ~/.claude/skills/superpowers