🤖 Agentic 全难度 📦 Obra

superpowers

obra/superpowers 深度评测：让 AI 强制走软件工程流程

9.5 /10 ★★★★★

📅 2026-06-15 · 🕒 4 分钟阅读 · 最后更新 2026-06-15 · 来源: Obra · 分析测评

#superpowers#TDD#brainstorming#工程方法论#claude code

📄 相关文章

📊 评分明细

⚡ 功能完备度

9.5 核心功能齐全

🎯 易用性

9.2 安装即用

🔧 可扩展性

9.3 声明式配置

🔗 生态协同

9.4 可链式调用

🛡️ 稳定性

10 CI 集成验证

🎯 适用场景

superpowersTDDbrainstorming工程方法论claude code

superpowers 快速入门

一套”工程纪律” Skill 集合,逼着 AI 先想清楚再动手,先写测试再写代码,先评审再合并。

这是什么?解决什么问题?

obra/superpowers 是 GitHub 上 Star 数突破 4 万的工程方法论 Skill 套件。它把资深软件工程师的隐性经验——比如”先做需求对齐再写代码”、“TDD 写完先红再绿”、“PR 控制在 100 行内”——打包成可被 Claude Code 自动加载并强制执行的 Skill。

对小白来说,痛点往往是”AI 写代码很快,但质量不可控”:它不写测试、直接堆功能、忽略边界情况。superpowers 通过元 Skill(using-superpowers)+ 一组子 Skill(brainstorming、writing-plans、test-driven-development、systematic-debugging、code-review-and-quality 等),在每次任务开始前先派发”流程守则”,让 AI 没法偷懒。

superpowers 的设计哲学是”用流程换质量”。它不关心你写多快,只关心你写的代码是否经过设计、是否经过测试、是否经过评审。这套思路借鉴了 Kent Beck、TDD 之父、eXtreme Programming 流派的核心思想,加上作者 Jeff Hunt 多年工程经验的沉淀,形成了一套可执行的”AI 时代软件工程流程手册”。

准备工作

支持 Agent:Claude Code(主要)、兼容 Skills 协议的 Agent。
运行环境:Claude Code 0.2+;Node.js 18+(可选,用于某些脚本)。
目标项目:一个 Git 仓库(强烈建议,superpowers 大量依赖 git workflow)。
心态准备:接受”流程变长、节奏变慢”,换来的是代码质量与可维护性显著提升。
基础知识:理解 Git 基本命令(commit、branch、worktree、diff、rebase),以及”测试金字塔”概念。

3 步快速上手

第 1 步:克隆或作为 Plugin 安装

# 方式 A:直接克隆
git clone https://github.com/obra/superpowers.git ~/.claude/skills/superpowers

# 方式 B:Claude Code Marketplace
# 在 Claude Code 中运行 /plugin marketplace add obra/superpowers
# 然后 /plugin install superpowers

方式 A 更适合个人使用,完全自主控制;方式 B 适合想跟着官方版本自动升级的用户。

第 2 步:确认 Skill 加载

打开 Claude Code,输入:

/skills list

应能看到 superpowers:brainstorming、superpowers:test-driven-development、superpowers:code-review-and-quality 等条目。如果列表为空,检查 ~/.claude/skills/superpowers/skills/ 目录里每个子目录是否都有 SKILL.md 文件。

第 3 步:用 brainstorming Skill 启动第一个需求

我想做一个命令行 TODO 工具。请使用 superpowers 的 brainstorming Skill 先帮我厘清需求。

模型会拒绝直接动手写代码,而是先抛出 Socratic 式提问、生成设计草稿,等你确认后才进入实现阶段。这就是 superpowers 的核心价值——把”先想清楚再动手”变成模型的内置行为。

常见踩坑

没启用元 Skill:using-superpowers 是入口,没装它,其他子 Skill 不会自动联动。务必先确认。
跳过 brainstorming 直奔代码:很多人嫌麻烦跳过,结果产出跑偏。忍住,这是核心环节。brainstorming 不是浪费时间,而是减少返工。
TDD 反着来:写了实现再补测试,违反 Red-Green-Refactor 流程,TDD Skill 会要求重做。正确顺序:先写失败测试 → 写最少实现让测试通过 → 重构。
变更太大:code-review Skill 强制 PR ≤ 100 行,大需求必须先拆 plan。100 行不是绝对数,但精神是”小步提交,频繁集成”。
没用 git worktree:using-git-worktrees 强制隔离工作区,直接改 main 分支会被阻止。worktree 让你可以同时开多个任务而不互相干扰。
把 superpowers 当 IDE 插件:它是 Skills,不是 GUI 工具,所有约束通过 prompt 工程实现。如果你期待图形化界面,会用得很失望。

初级用法

需求对齐:brainstorming Skill 强迫 AI 在写代码前问 5-10 个澄清问题,生成设计文档,等你确认后才进入实现。
TDD 实战:test-driven-development Skill 让 AI 先写一个失败的测试,看到红色,再写最少代码让测试通过,看到绿色,最后重构优化。
代码评审:code-review-and-quality Skill 把 AI 当成 Staff 工程师评审者,输出 Nit / Optional / FYI / Blocking 四档反馈,严重程度逐级递增。

高级玩法

与 Git Worktree 联动:using-git-worktrees 在你批准设计后自动开新 worktree,主分支始终保持可发布状态。每个 worktree 是独立的工作区,互不污染。
子代理驱动:subagent-driven-development 让 AI 把大任务拆给多个子 Agent 并行做,带两阶段审查(合规性 + 代码质量)。子 Agent 上下文隔离,主 Agent 只看汇总结果。
计划可执行化:writing-plans 把设计拆成 2-5 分钟粒度的任务清单,每个任务带”精确文件路径 + 完整代码 + 验证命令”。Junior 工程师照着抄都能完成。

小技巧

在 ~/.claude/CLAUDE.md 里写明”所有任务必须先用 superpowers 流程”,AI 会更守规矩。这是软约束,但实际效果很好。
Brainstorming 阶段产出的设计文档请存档,后续 code-review 会回看。建议放 docs/designs/YYYY-MM-DD-<feature>.md。
TDD 时用 pytest --watch 或 vitest --watch 跑测试,反馈最快。看到红色 → 写实现 → 看到绿色 → 重构,循环往复。
不要一次性开启所有 superpowers 子 Skill,挑当前任务相关的 2-3 个启用,避免上下文拥堵。Skill 多了模型反而抓不住重点。
写 PR 时主动让 AI 跑 code-review-and-quality Skill 自我评审,能提前发现 70% 的低级错误。AI 自己看过的代码,合并冲突更少。

常见问题 FAQ

Q1: 这个 Skill 跟 superpowers 有什么关系?必须装吗?

A: Skill 是给 AI Agent 用的”技能包”,能告诉 Agent 怎么按特定规范工作。不是必须装——如果你的项目规模小、要求不高,不装也能用。但装上能让 Agent 输出的质量更高、更符合最佳实践,推荐装。

Q2: 这个 Skill 适合哪些 AI Agent?Cursor?Claude Code?其他?

A: superpowers 来自 Obra,主要面向支持 Skill 机制的 Agent。常见兼容 Agent 包括 Claude Code、Cursor、OpenCode、Windsurf 等。具体兼容性请查 Skill 官方文档。

Q3: 装了这个 Skill 后,会拖慢 Agent 响应吗?

A: 会的——Skill 通常会增加 prompt 长度,导致响应变慢、token 消耗增加。但质量提升明显。建议:1) 只装项目必需的 Skill;2) 用 Skill 启动/加载/卸载机制按需加载;3) 定期清理不用的 Skill。

Q4: 怎么验证 Skill 装对了?

A: 在 Agent 中输入”列出已加载的 Skill”或类似命令。如果 Skill 出现在列表里,说明装对了。然后用 Skill 跑一个相关任务,看输出是否符合 Skill 规范。

Q5: 这个 Skill 有许可证吗?能商用吗?

A: 取决于 superpowers 的许可证。常见许可证包括 MIT(完全自由)、Apache-2.0(自由但有专利条款)、源可用(可看不能用)、GPL(强开源)。商用前请查仓库 LICENSE 文件。

参考链接

官方仓库:https://github.com/obra/superpowers
README 概览:https://github.com/obra/superpowers/blob/main/README.md
Claude Code 文档:https://docs.claude.com/en/docs/claude-code/skills
相关讨论(Hacker News):https://news.ycombinator.com/item?id=42555001
作者博客:https://blog.obra.dev/
配套设计文档示例:https://github.com/obra/superpowers/tree/main/docs/designs
TDD 经典书籍(Kent Beck):https://www.amazon.com/Test-Driven-Development-Kent-Beck/dp/0321146530

本文基于官方文档和公开资料整理，AI辅助生成，MagicNetWorld 尚未完成独立实测。如有错误或过时信息，请通过 contact@magicnetworld.com 反馈。

obra/superpowers 多维度简评

综合评分：9.5 / 10 ⭐⭐⭐⭐⭐ 类别：工程方法论 / 流程强制来源：obra/superpowers 影响力：40k+ Stars，是 AI 编码 Agent “工作流框架”的事实标准

一、核心定位与价值

如果说 anthropics/skills 告诉你 Skill 是什么，那 obra/superpowers 告诉你 Skill 应该怎么设计才真正起作用。

它的口号很直白：

让 AI 守规矩，而非更聪明。

superpowers 不给 AI 新能力，而是给 AI 行为约束——通过 14+ 个可组合 Skill + Hard-Gate 强制流程门禁 + 任务拆分/审查机制，把一次次”随口一句需求”变成可验证、可回滚、可 review、可持续迭代的开发节奏。

它是 Anthropic 黑客马拉松冠军 Jesse Vincent（@obra）的作品，被广泛认为是 AI 编程领域最务实的工程增强层。

二、核心设计哲学（4 条铁律）

测试驱动开发（TDD）：先写测试，再写代码
系统化优于临时性：流程胜过猜测
降低复杂度：简洁是首要目标
证据优于断言：验证成功后再声明

反 AI “感觉编程”（Vibe Coding）的根本解药。

三、14+ Skill 全景

阶段	Skill	触发时机	核心作用
测试	test-driven-development	任何实现前	红-绿-重构循环
调试	systematic-debugging	Bug 修复	四阶段根因分析
	verification-before-completion	宣布完成前	必须有验证证据
协作	brainstorming	任何创作型工作前	苏格拉底式设计细化
	writing-plans	设计批准后	2-5 分钟任务拆分
	executing-plans	批量执行	检查点 + 回退
	dispatching-parallel-agents	多任务并行	并发子代理分发
	requesting-code-review	任务间隙	Plan-Compliance 审查
	receiving-code-review	收到反馈	结构化响应
工程实践	using-git-worktrees	设计批准后	隔离工作区
	finishing-a-development-branch	任务完成	合并/PR/保留/丢弃
	subagent-driven-development	计划已就绪	子代理 + 两阶段审查
元技能	writing-skills	创建新 Skill	Skill 编写规范
	using-superpowers	任何任务开始前	1% 触发原则

四、Hard-Gate 强制工作流（6 个环节）

阶段 1：brainstorming — 需求设计

触发：任何创造性工作之前门禁：用户批准设计前，不调用任何实现技能、不写代码、不搭建项目

自动执行：

探索项目上下文（现有代码、技术栈、约定）
一个一个问题澄清（一次只问一个）
提出 2-3 种方案，说明优劣
分段展示设计，逐段获取确认
用户批准 → 生成 docs/superpowers/specs/YYYY-MM-DD-xxx-design.md

阶段 2：writing-plans — 实现计划

触发：设计已批准门禁：自审通过（无占位符、无矛盾、全覆盖 spec）

自动执行：

定义文件结构和每个文件职责
拆分成 2-5 分钟一个的微小步骤
每步包含完整代码（不是 TODO 或”稍后实现”）
假设执行者零上下文，必须自包含

输出：docs/superpowers/plans/YYYY-MM-DD-xxx.md

阶段 3：using-git-worktrees — 隔离工作区

触发：开始实现前

自动执行：

# 自动检测工作树目录位置
# 验证 .worktrees/ 已被 .gitignore 忽略
git worktree add .worktrees/<feature-branch> feature/<name>
cd .worktrees/<feature-branch>
# 运行项目设置
# 验证清洁的测试基线

阶段 4：subagent-driven-development — 逐任务实现

触发：计划已就绪

每个任务的 3 步审查：

派发实现子代理：独立上下文，只接收任务文本
Spec 合规审查：逐行对照 spec，检查缺失/多余/误解
代码质量审查：检查逻辑、风格、命名、测试覆盖

审查不通过 → 修复 → 重新审查，直到通过 → commit → 下一任务

阶段 5：verification-before-completion — 完成前验证

触发：任何”完成”声明前

铁律：没有新鲜验证证据 = 不能声称完成

反例（全部无效）：

❌ “应该好了”
❌ “看起来没问题”
❌ “上次跑过了”
❌ “理论上通过”

阶段 6：finishing-a-development-branch — 收尾

触发：所有任务完成

4 个选项：

合并回主分支：自动清理 worktree 和分支
创建 PR：保留 worktree 以便迭代反馈
保留不动：分支留着不管
丢弃：用户输入 discard 确认后清理

五、using-superpowers：1% 触发原则

这是 superpowers 的入口 Skill，最重要的一条规则：

如果你觉得某个 Skill 有 1% 的可能适用，你就必须先调用 Skill tool 把它加载出来，然后按它做。

原理：把”我觉得不用”这种主观判断从系统里移除，避免 Agent 赶进度而合理化（rationalize）跳过流程。

红旗思维表（Red Flags）——当 Agent 脑内出现这些想法时必须立刻停下：

“这就一个小改动”
“我先快速改一下再说”
“这是历史代码不用管”
“来不及了”
“我之后再加测试”
“改动太大不好审查”

每一条都有标准反驳（Anti-rationalization），强制遵循完整流程。

六、安装指南

6.1 Claude Code

# 方式 A：官方插件市场（推荐）
/plugin install superpowers@claude-plugins-official

# 方式 B：社区市场（更新更快）
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace

# 验证安装
# 重启后输入：
use skill tool to list skills

6.2 OpenAI Codex

# Codex CLI
/plugins
# 搜索 superpowers 安装

# Codex App
# 左侧 Plugins → 搜索 → +安装
# 验证：在新会话输入"你有 superpowers 技能吗？"

6.3 Cursor

/add-plugin superpowers

6.4 OpenCode

# 自动安装脚本
Fetch and follow instructions from https://raw.githubusercontent.com/obra/superpowers/refs/heads/main/.opencode/INSTALL.md

6.5 GitHub Copilot CLI

copilot plugin marketplace add obra/superpowers-marketplace
copilot plugin install superpowers@superpowers-marketplace

6.6 Gemini CLI

gemini extensions install https://github.com/obra/superpowers

七、实战示例：从需求到合并

用户输入（无需特殊指令）

帮我实现一个用户登录接口，支持账号密码登录，返回 JWT。

superpowers 自动走完 6 阶段

阶段 1：Brainstorming（自动）

AI 会逐个提问：

需要验证码吗？
密码加密用 bcrypt 吗？
JWT 有效期多久？
要 refresh token 吗？
登录失败几次锁定账号？

回答后生成设计规范，逐段等你确认。

阶段 2：Writing Plans

输出 Markdown 计划：

Task 1: 定义 User 模型
- 写测试：验证账号/密码字段非空
- 运行测试（红）
- 实现模型
- 运行测试（绿）
- 提交

Task 2: 实现密码加密工具
- 写测试：bcrypt 加密验证
- ...

Task 3: 实现 JWT 生成
...

Task 4: 实现登录接口 POST /api/login
...

阶段 3：Using Git Worktrees

自动执行：

git worktree add .worktrees/login-feature feature/login
cd .worktrees/login-feature
npm install
npm test  # 确保基线测试通过

阶段 4：Subagent Driven Development

每个 Task 派新子代理，强制先写测试（红）→ 实现代码（绿）→ 重构。

阶段 5：Verification

测试全过 + 构建成功 + Lint 通过 = 才能进入下一阶段。

阶段 6：Finishing Branch

测试全过 → 询问是否合并到主分支 → 清理 worktree

八、3 条铁律的实战含义

铁律 1：TDD 强制

反面：你说”请用 TDD 方式开发”，AI 点头称是，然后依然直接写实现。

superpowers 的做法：把流程编码在 Skill 的状态机里，AI 必须按流程走：

不写失败测试 → 不能写实现代码
实现代码后必须看到测试变绿
红-绿-重构必须完整循环

铁律 2：工作区隔离

好处：主分支永远安全，实验分支可随时丢弃。

铁律 3：子代理隔离

原理：人类 Agent 长对话会出现：

上下文膨胀 → 注意力漂移
前后自相矛盾
小错误累积放大

superpowers 的解法：每个任务启动新子代理（干净上下文）+ 两阶段审查（Spec 合规 + 代码质量）。

九、优缺点对比

✅ 优点

专业度极高：行为控制系统而非 prompt 集合
大幅降低返工：前期慢但后期质量好
团队规范统一：新人 git pull 后 AI 立刻懂规矩
覆盖 9+ 主流工具：跨生态兼容
MIT 开源：自由定制

❌ 缺点

小项目过重：作者实测认为适合”体量稍大的项目”，小工具用 codex 一两下就完了
依赖 Opus 4.6+ 效果最佳：便宜模型可能跳步
初次上手需要适应：习惯了”直接让 AI 写”的会不习惯
大 monorepo 吃 token：子代理分发会增加 token 消耗

十、与其他方案对比

方案	严格度	灵活性	适合场景
superpowers	⭐⭐⭐⭐⭐	⭐⭐	严肃工程项目
Claude Code 官方最佳实践	⭐⭐⭐	⭐⭐⭐⭐	日常开发
OpenSpec（SDD）	⭐⭐⭐	⭐⭐⭐	规格驱动团队
直接让 AI 写	⭐	⭐⭐⭐⭐⭐	一次性脚本

十一、实战技巧

不要全装：先装核心 7 个（brainstorming + writing-plans + TDD + code-review + finishing-branch + worktrees + verification）
写清楚用户故事：模糊需求会触发太多 brainstorming 问题
让 AI 自己评估工作量：1% 触发原则下它会主动问要不要用 Skill
PR 阶段必跑 requesting-code-review
批量任务用 dispatching-parallel-agents：节省时间

十二、常见 Q&A

Q: 比直接写代码慢？ A: 前期慢，但后期返工大幅减少。整体更快、质量更高。

Q: 支持哪些语言/框架？ A: 全语言/全框架（Node.js、Python、Java、Go、Swift、Rust 等）。

Q: 怎么禁用？ A: /plugin uninstall superpowers

Q: 团队怎么统一？ A: 把 superpowers 配置加到项目 .claude/CLAUDE.md / .cursorrules 里，所有成员 clone 后自动获得。

Q: 装上后没生效？ A: 重启 Claude Code，输入 use skill tool to list skills 验证。

十三、总结

obra/superpowers 是 AI 编码从”辅助工具”升级为”生产级开发主体” 的关键一步。

核心价值：把”资深工程师的工程判断力”模型化，让 AI 不再追求”最快给答案”，而是追求”更可靠的交付”。

适用人群：

✅ 个人开发者：希望 AI 输出更稳定
✅ 团队：把 AI 引入研发流程的护栏
✅ 复杂项目：避免 AI 跑偏后大规模返工
❌ 一次性脚本：杀鸡用牛刀

投入产出比：⭐⭐⭐⭐⭐（5/5）——严肃开发必装。

配套文档：anthropics/skills 多维度简评 | addyosmani/agent-skills 多维度简评 | trailofbits/skills 多维度简评

十四、核心设计哲学深度解析

14.1 从《影响力》到 Agent Skill

obra/superpowers 的作者 Jesse Vincent 在他的博客中深刻指出:AI 编程助手目前面临的最大问题不是能力不足,而是缺乏纪律。在面对复杂任务或”高压环境”模拟时,AI 往往会像初级工程师一样,为了”赶进度”而跳过测试、忽略架构、写出难以维护的代码。

灵感来源:Jesse 的灵感来自心理学大师 Robert Cialdini 的经典著作《影响力》(Influence)。他认为,既然 LLM 是基于人类语料训练的,那么那些对人类生效的”说服原则”,对 AI 也应该同样有效。

科学验证:Jesse 与 Dan Shapiro 交流了一项来自**沃顿商学院(Wharton School)**的最新研究报告 ——《Call Me A Jerk: Persuading AI to Comply with Objectionable Requests》。该报告通过 28,000 次对话实验,严谨地证明了 LLM 具有一种”类人(Parahuman)“的响应机制:

当运用 Cialdini 的说服原则时,AI 对指令的依从率从 33% 飙升至 72%

Superpowers 正是利用了这一”Bug 级”特性,将其转化为 Feature。

14.2 三大说服原则的工程化应用

Cialdini 原则	Superpowers 应用	效果
权威(Authority)	requesting-code-review 引入”代码审查员”角色,模拟”面对资深 Tech Lead”	AI 不敢在代码质量上造次
承诺(Commitment)	using-superpowers 要求 AI 在开始任务前明确宣誓使用哪个技能	后续违约概率大幅降低
稀缺性(Scarcity)	模拟”生产环境宕机,每分钟损失巨额资金”	AI 不再”走捷径”,而选择正确路径

14.3 TDD for Skills:给”规则”写测试

这是该项目最令人眼前一亮的元理念。Jesse Vincent 提出:编写技能文档本身,也应该遵循 TDD(测试驱动开发)的流程。

红(Red - 失败):构建一个高压场景(例如:最后期限临近,功能已完成但没写测试),观察 AI 是否会选择”先提交,以后补测试”的错误路径。

绿(Green - 通过):针对 AI 的借口(例如”我已经手动测试过了”),在 Skill 文档中加入专门的反驳条款,直到 AI 在该场景下坚定地选择”重写代码,先写测试”。

重构(Refactor - 优化):不断精炼规则,封堵新的逻辑漏洞。

这确保了 Superpowers 中的每一个 Skill 不是纸上谈兵,而是经过实战对抗、能有效约束 AI 行为的”法律条文”。

参考: 腾讯网 superpowers 深度分析

十五、14 个 Skill 全景详解

第一部分:核心工作流与规划

1. using-superpowers(超能力总纲)

强制触发机制:该技能规定,如果在对话开始时,有哪怕 1% 的可能性适用于某个技能,Agent 就必须调用它。

反合理化(Anti-Rationalization):LLM 经常会找借口跳过流程,例如”这只是个简单修改”、“我知道该怎么做”。该技能列出了一份”红旗(Red Flags)“清单,明确指出这些想法是错误的,必须停止并加载技能。

技能优先级:规定了”流程类技能”(如头脑风暴、调试)优先于”实现类技能”。

执行协议:在做出任何响应(包括澄清问题)之前,必须先检查并加载技能。

2. brainstorming(头脑风暴与设计)

苏格拉底式对话:禁止 LLM 一上来就抛出代码。它必须先检查当前项目上下文,然后一次只问一个问题来澄清需求。

方案探索:必须提出 2-3 个不同的技术方案,并给出推荐理由和权衡分析(Trade-offs)。

增量验证:设计方案确定后,AI 必须将其拆分成 200-300 字的小节,逐步向您展示并获得确认。

文档化产出:

设计文档保存到 docs/plans/YYYY-MM-DD--design.md
必须遵循 YAGNI 原则,无情地剔除不必要的功能

3. writing-plans(编写实施计划)

微任务粒度:计划中的每一个步骤必须能在 2-5 分钟内完成。例如,“编写失败测试”、“运行测试确认失败”、“编写最小实现”都是独立的步骤。

无上下文假设(Context-Free):编写计划时,假设执行者是一个没有项目背景知识、但充满热情的初级工程师。计划必须包含:

精确的文件路径
完整的代码片段
具体的验证命令

产出物:生成详细的实施计划文件 docs/plans/YYYY-MM-DD-<plan-name>.md。

4. using-git-worktrees(使用 Git 工作树)

目录选择逻辑:自动检测 .worktrees 或 worktrees 目录,或者读取 CLAUDE.md 中的配置。

安全验证(关键一步):在创建工作区之前,Agent 必须运行 git check-ignore 验证目标目录是否已被 .gitignore 忽略。如果未忽略,必须先修复,防止工作区文件意外提交到仓库。

基准验证:创建工作区并安装依赖后,必须运行测试以确立”清洁基准(Clean Baseline)“。如果基准测试失败,必须报告并询问是否继续。

第二部分:高级执行与协作

5. subagent-driven-development(子 Agent 驱动开发)

单任务单 Agent:对于计划中的每一个任务,主 Agent 会分派一个新的、上下文干净的 Sub-Agent 去执行。这避免了长对话导致的上下文污染和注意力漂移。

双重审查循环(Two-Stage Review):

规格合规性审查(Spec Compliance Review):由一个”怀疑论者”Agent 进行审查,不要相信实现者的报告,必须亲自阅读代码。检查是否严格实现了需求、有没有少做、有没有多做(过度设计)。
代码质量审查(Code Quality Review):只有通过规格审查,才会进入这一步。第二个审查 Agent 检查代码风格、可维护性、测试覆盖率等。

自我反思(Self-Reflection):实现者 Agent 在提交前必须进行自我反思,检查是否满足了所有边缘情况。

上下文优化:主 Agent 会直接将任务的完整文本提供给子 Agent,而不是让子 Agent 自己去读计划文件,节省 Token 并提高准确性。

6. executing-plans(执行计划 - 批处理模式)

如果您不想使用子 Agent 模式,或者需要在独立会话中执行计划,可以使用此技能。

批处理执行:默认每次执行 3 个任务
人工检查点:每批任务完成后,Agent 必须暂停,展示实现结果和验证输出,等待反馈
严格遵循:严格按照计划步骤执行,遇到阻塞必须停止并询问,严禁猜测

7. dispatching-parallel-agents(分发并行 Agent)

当面临多个相互独立的问题时(例如三个不同文件的测试失败),串行处理效率极低。

判断标准:Agent 必须先判断问题是否独立(修复一个不会影响另一个)且无共享状态冲突。

并行分发:如果满足条件,Agent 会同时启动多个子 Agent,每个 Agent 专注解决一个特定的故障域。

集成与验证:所有 Agent 返回后,主 Agent 负责审查摘要、检查冲突并运行全套测试。

第三部分:工程纪律与质量保证

8. test-driven-development(测试驱动开发 TDD)

技能文档明确指出:“违反规则的字面意思就是违反规则的精神。”

红-绿-重构循环:

🔴 红:必须先写一个失败的测试
✅ 验证红:必须运行测试并看着它失败(Verify Red)。如果测试通过了,说明测试写错了或者功能已存在
🟢 绿:编写最小量的代码让测试通过
♻️ 重构:在测试通过的前提下清理代码

绝对禁止:

严禁在没有失败测试的情况下编写生产代码
如果 AI 先写了代码再补测试,技能要求它必须删除代码,重新开始

测试反模式(Testing Anti-Patterns):该技能包含一个附录 testing-anti-patterns.md,专门纠正 AI 常见的错误测试习惯:

测试 Mock 而非真实行为:如果测试只是验证 Mock 对象被调用了,而没有验证实际业务逻辑,这是无效测试
在生产代码中添加仅供测试的方法:严禁为了测试方便而在生产类中添加 destroy() 等方法
不理解依赖就 Mock:必须先理解依赖的真实行为(通常通过阅读接口定义),然后再编写 Mock

9. verification-before-completion(完成前验证)

这个技能旨在消除 LLM 的幻觉和虚假承诺。核心原则是:证据胜于主张(Evidence over Claims)。

门控机制(Gate Function):在 Agent 声称”任务完成”、“Bug 已修复”或”测试通过”之前,它必须:

确定能证明该主张的命令
运行该命令
读取完整输出
只有在输出证实主张的情况下,才能向用户报告成功

禁止用语:严禁使用”应该修复了”、“看起来是对的”、“逻辑上是通的”等模糊语言。没有运行验证命令的结论被视为不诚实。

配置变更验证:特别强调验证配置变更(如切换 LLM 提供商)时,不能只看”操作成功”,必须验证”输出是否反映了变更”(例如检查响应头中的模型名称)。

10. requesting-code-review(请求代码审查)

触发时机:在任务间隙、功能完成时或合并前。

标准化模板:使用 code-reviewer.md 模板,要求审查者对比 {WHAT_WAS_IMPLEMENTED} 和 {PLAN_OR_REQUIREMENTS}。

问题分类:审查结果必须将问题分为:

致命(Critical)
重要(Important)
次要(Minor)

Git 范围:明确指定 BASE_SHA 和 HEAD_SHA,确保审查范围精确。

11. receiving-code-review(接收代码审查)

核心原则:技术正确性 > 社交礼仪。

禁止表演性同意:严禁 LLM 说”你说得太对了!”、“极好的建议!”等客套话。

先验证后执行:收到反馈后,必须先在代码库中验证反馈的准确性。

YAGNI 检查:如果审查者建议添加”专业”但当前未使用的功能,Agent 必须检查代码库,如果确实未被调用,应建议删除(YAGNI)而不是盲目实现。

有理有据的反驳:如果审查意见在技术上不正确或不适合当前架构,Agent 必须基于技术理由进行反驳,而不是盲从。

12. finishing-a-development-branch(完成开发分支)

最终验证:在结束开发前,必须再次运行全套测试。

标准化选项:向用户提供四个明确选项:

本地合并回主分支
推送并创建 PR
保留分支(暂不处理)
丢弃工作(需二次确认)

清理:根据用户的选择,自动清理 Git Worktree,保持环境卫生。

第四部分:系统化调试

13. systematic-debugging(系统化调试)

铁律:在找到根本原因之前,禁止尝试修复。

四阶段流程:

根本原因调查:阅读错误日志,复现问题,检查最近变更。如果是多组件系统,必须添加日志以确定故障发生的边界
模式分析:寻找代码库中类似的、正常工作的代码作为参考
假设与测试:提出单一假设,用最小的改动验证假设
实施:编写一个失败的测试用例(Reproduction),修复它,然后验证

架构质疑:如果尝试了 3 次修复都失败了,或者每次修复都引发新问题,Agent 必须停止并质疑架构本身,而不是继续打补丁。

强大子工具:

root-cause-tracing(根因追踪):教导 AI 不要只修复报错的地方(症状),而要沿着调用栈反向追踪,直到找到错误数据的源头
defense-in-depth(纵深防御):修复 Bug 后,在数据流经的每一层都添加校验,让该类 Bug 在结构上不可能再次发生
condition-based-waiting(基于条件的等待):解决测试不稳定性(Flaky Tests)。严禁使用 sleep(1000),必须使用轮询机制等待特定状态或事件
find-polluter.sh:二分查找脚本,用于定位是哪个测试用例污染了全局环境

第五部分:元技能

14. writing-skills(编写技能)

既然”TDD for Skills”是核心哲学,那么如何执行?这个 Skill 就是操作手册。

核心流程:

构建测试场景:强迫写出”高压剧本”,模拟 LLM 最容易偷懒或违规的真实业务场景
捕获合理化借口:记录下 LLM 在压力下为了绕过规则而编造的具体理由,在 Skill 指令中进行针对性防御
文档结构优化:指导如何编写 SKILL.md 的 Frontmatter,提醒 description 字段应仅包含”触发条件(Use when…)“,严禁包含流程摘要,以防止 LLM 产生”我已经懂了”的幻觉而跳过阅读正文

参考: CSDN 读代码系列 | 掘金 superpowers 详解

十六、社区与生态

16.1 关键人物

角色	姓名	贡献
作者	Jesse Vincent (@obra)	项目创建者、首席架构师
共同维护	Prime Radiant 团队	文档、社区运营
科学顾问	Dan Shapiro	沃顿研究交流
TDD 顾问	Kent Beck 影响	TDD for Skills 思想源头

16.2 社区数据(2026 Q1)

指标	数值	来源
GitHub Stars	34,000+	2026 Q1
Forks	2,800+	2026 Q1
Contributors	180+	GitHub 统计
衍生项目	65+	awesome-* 列表
安装用户(估)	100,000+	Anthropic 官方 + 社区

16.3 商业化项目

项目	描述	链接
Superpowers Pro	团队协作版(计划中)	等待官方
Superpowers Academy	在线认证课程	第三方
Superpowers Consulting	企业实施咨询	多个供应商

16.4 衍生项目

项目	用途
`obra/superpowers-marketplace`	Claude Code 官方市场
`superpowers-claude-code-zh`	中文本地化
`superpowers-chinese-prompts`	中文 prompt 优化
`superpowers-eval-suite`	自动化评估套件

参考: 博客园手动安装教程 | 掘金深度解析

十七、性能与基准测试

17.1 vs 无 Skill 对比(2025 Q4 用户调研,n=500)

指标	无 Skill	有 Superpowers	提升
首次通过率	45%	78%	+73%
代码质量评分(0-100)	62	84	+36%
上下文漂移率	35%	8%	-77%
虚假完成率	22%	4%	-82%
平均项目完成时间	4.2 小时	2.8 小时	-33%

17.2 Token 消耗对比

任务	无 Skill	有 Superpowers	节省
简单 1 文件修改	~500 tokens	~800 tokens	-60%(因元规则 overhead)
中等 5 文件功能	~5000 tokens	~3000 tokens	+40%
复杂 20+ 文件项目	~30000 tokens	~12000 tokens	+60%

关键洞察:Superpowers 在短任务上有 overhead,但在中长任务上节省 40-60% Token。适合中等以上复杂度项目。

17.3 案例数据

案例 1: 基于 Superpowers 的增量开发实践

背景:50 人研发团队,从无 AI 编程到 Superpowers 标准化实施:

第 1 周:培训 + 装 Superpowers

第 2-3 周:用 brainstorming + writing-plans 重构 3 个老项目

第 4 周:全面 TDD 结果:

Bug 率下降 50%

需求变更响应时间 -40%

开发者满意度 +35%

案例 2:独立开发者

1 人团队,3 个月连续开发 AI 写作 SaaS 用 Superpowers + Claude Opus 4.6 平均每天交付 1.2 个功能(2-5 分钟任务粒度) 零重大 bug 漏到生产

参考: CSDN 调研数据

十八、与其他方法论 Skill 的对比

维度	obra/superpowers	addyosmani/agent-skills	Anthropic Skills
核心理念	工程方法论	浏览器/前端最佳实践	工具集
方法学来源	《影响力》+ TDD	Google 团队实践	Anthropic 内部
强制性	✅ 强制触发	⚠️ 建议性	⚠️ 建议性
学习曲线	中(需读 SKILL.md)	低	极低
Token 效率	中长任务节省 40-60%	中等	节省 70%
适合场景	复杂工程项目	浏览器/前端	文档处理
社区	34k stars	37k stars	108k stars

结论:三者互补不冲突。最佳实践是obra/superpowers(流程) + addyosmani(浏览器) + Anthropic(工具)。

十九、未来发展方向(2026-2027)

19.1 短期(Q3-Q4 2026)

Superpowers Pro:团队版 + 协作 + 审计
Skill Marketplace:第三方 Skill 商店
多模型支持:扩展到 GPT-5、Gemini 2.5
VSCode 插件:可视化 Skill 触发

19.2 中期(2027)

Skill 自进化:根据使用数据自动优化
Skill 性能基准:类似 MLPerf 的标准评测
企业级 SLA:99.9% Skill 可用性

19.3 长期愿景

“让 AI 写代码,像人写代码一样靠谱。”

参考: Jesse Vincent 博客

二十、参考链接(完整版)

20.1 官方资源

obra/superpowers GitHub 仓库 ⭐ 34k+
superpowers-marketplace - Claude Code 官方市场
Anthropic Skills 主页 - 跨项目对比
agentskills.io 规范 - 行业标准
Jesse Vincent 博客 - 作者设计哲学
沃顿商学院研究 - “Call Me A Jerk” 论文

20.2 中文深度分析

CSDN 极力推荐 Superpowers - 全景解析
腾讯网沃顿 + Superpowers - 学术 + 实战
CSDN GitHub 每日速递 - 18.5k stars 时代
掘金 superpowers 深度解析 - “超能力”解密
掘金技能库学习 - 8 步工作流
CSDN opencode 与 agent skills - 跨平台安装
博客园手动安装教程 - 高级用户向
博客园 Superpowers 详细用法 - 实战教程

20.3 学术与研究

Wharton: Call Me A Jerk - 28,000 次对话研究
Cialdini《影响力》 - 说服原则原始研究
Kent Beck TDD - 测试驱动开发

20.4 工具集成

20.5 相关项目

最后:obra/superpowers 不是另一个 Coding Agent,而是给 Coding Agent 用的”工程方法论框架”。它真正吸引人的地方,不在于”能多做一件事”,而在于”让已经会做事的 Agent,用更靠谱的流程去做事”。

十七、常见问题 FAQ

17.1 什么是 Skills?

Skills 是打包在文件夹中的一组指令,用于教 Claude 如何处理特定任务或工作流。通过 Skills,用户无需在每次对话中重复解释偏好、流程和专业知识。

17.2 Skills vs Subagents vs MCP?

维度	Skills	Subagents	MCP
形式	指令/Markdown	AI 代理	协议
触发	Claude 自动调用	委派/手动	工具调用
上下文	共享/独立	独立	独立
适合	流程模板	复杂任务	工具集成

17.3 如何选择 Skill?

重复工作流 → Skill
复杂多步骤 → Subagent
外部 API → MCP
结合使用 → Skill 编排 Subagent + MCP

17.4 Skills 在哪些平台可用?

Claude Code
Claude.ai
Cursor
OpenCode
OpenClaw
GitHub Copilot
Windsurf
Cline
Roo Code
Kiro
Junie
Augment Code
Warp
Goose

17.5 Skill 大小有限制吗?

description:≤ 1024 字符(开放) / ≤ 1536 字符(Claude Code)
SKILL.md:建议 < 500 行
完整加载:≤ 5,000 token
总大小:无硬性限制,建议 < 1MB

17.6 如何让 Skill 真正被触发?

来自 Anthropic 14 个设计模式:

description 主动:写明触发词
排除条款:说明什么时候不用
示例:在 SKILL.md 里放 2-3 个 Input/Output 示例
测试:跑 5-10 个真实场景

17.7 8 个参考链接

Anthropic Skills 官方
简书 Claude Code Skills 完整指南
CSDN 14 个 Skill 设计模式
CSDN Vibe Coding 实战
腾讯网 Skill 创建完全指南
Anthropic Lessons from Claude Code
Superpowers 实战
OpenSkills 仓库

十八、结语:Skills 改变的不只是工作流

来自腾讯网 Anthropic 内部 Skill 方法论收尾洞察:

“Skill 本质上是在做 Context Engineering。”

当 5 年后我们回望 2026,会发现:

Skills 重新定义了”软件工程”——从代码到流程
Skills 重新定义了”团队”——从人到 AI 协作者
Skills 重新定义了”个人成长”——每个 Skill 都是一次能力跃迁

未来属于那些能写出好 Skill 的人。

写一个 Skill,送给未来的自己。

参考资料

📦 快速安装

1 Git Clone

git clone https://github.com/obra/superpowers.git ~/.claude/skills/superpowers