verification-loop
实现后强制验证循环,确保行为正确。
评分明细
适用场景
verification-loop 快速入门
“代码写完了”不算完,必须验证它真的能跑、真的对。
这是什么?解决什么问题?
每个开发者都经历过这种场景:代码写完,信心满满提 PR,CI 一跑——红了。然后发现某个边界条件没考虑到、某个依赖没装、某个测试用例过时了。如果 PR 已经合并到主分支,后果可能是线上事故。
verification-loop Skill 把”实现后验证”流程自动化。它强制 AI 在每个功能实现后,做完整验证循环:
- 静态检查:lint、type check、format 都能跑过
- 单元测试:核心逻辑覆盖
- 集成测试:模块间交互正确
- 行为验证:实际运行,确认输出符合预期
- 持续 CI:每次提交都跑,不留未验证代码
这个 Skill 来自 affaan-m 的 everything-claude-code 仓库,GitHub 16k+ stars,核心思想是”防漏测”:任何代码没有通过完整验证循环前,都不算完成。
准备工作
- 项目的测试框架已配置(Jest、pytest、Go test 等)
- CI 已配置(GitHub Actions、GitLab CI 等)
- 支持 Agent Skill 的 AI 客户端
- 基本的命令运行能力
- 至少 20 分钟时间
3 步快速上手
第 1 步:克隆仓库
git clone https://github.com/affaan-m/everything-claude-code.git
cd everything-claude-code
ls skills/verification-loop/
你会看到 SKILL.md、验证脚本模板、CI 配置示例。
第 2 步:加载 Skill
claude --skill verification-loop
第 3 步:让 AI 帮你完成验证循环
实现一个功能后,告诉 AI:
“我刚实现了订单取消接口(src/api/orders.py::cancel_order),请按 verification-loop 帮我做完整验证。”
AI 会按顺序跑完:
[STEP 1: 静态检查]
- ruff check src/api/orders.py → 通过
- mypy src/api/orders.py → 通过
[STEP 2: 单元测试]
- pytest tests/api/test_orders.py::test_cancel_order → 通过
- 覆盖率:95% (>= 80% 阈值) ✓
[STEP 3: 集成测试]
- pytest tests/integration/test_order_flow.py → 通过
[STEP 4: 行为验证]
启动服务并调用接口:
- curl POST /api/v1/orders/123/cancel -H "Auth: ..."
- 响应: {"status": "cancelled", "refund_id": "ref_..."}
- 数据库检查:订单状态确实是 cancelled ✓
- 边界:取消已发货的订单 → 正确返回 422 ✓
- 边界:取消不存在的订单 → 正确返回 404 ✓
[STEP 5: 持续 CI]
- GitHub Actions 配置: lint + test + e2e
- 每次 push 自动跑
- 报告生成:badge.svg 可嵌入 README
[结论] 所有验证通过,可以合并
常见踩坑
- 只跑测试,不跑 lint/type:测试通过不代表代码可维护。Skill 强制全跑。
- 测试覆盖率造假:写一堆只调一行代码的测试,覆盖率虚高。Skill 会看测试质量。
- 跳过集成测试:单元测试过了但服务起不来,集成测试能发现这类问题。Skill 强制要求。
- 行为验证不真实:用 mock 假数据验证,和真实环境差异大。Skill 强调端到端验证。
- CI 配置不更新:本地能跑、CI 跑不起来,通常是依赖或环境差异。Skill 会把 CI 步骤和本地步骤对齐。
- 没验证边界条件:只验证 happy path,异常路径没测。Skill 强调边界用例。
初级用法
- 每个 PR 跑一遍:实现新功能后,用 Skill 跑完整验证,有问题立刻改。
- Bug 修复后回归:修完 Bug 不仅要测试这个分支,还要测试相关功能没退化。
- 代码重构后:重构不改行为,但要确认行为真的没改。Skill 帮你做这事。
高级玩法
- 集成 mutation testing:故意改坏代码,看测试能不能抓到。Skill 支持 Stryker(mutatest 等工具。
- Performance regression:不仅验证功能正确,还验证性能不退步。Skill 支持基准测试。
- Contract testing:对 API 消费者做契约测试,确保 API 变更不破坏下游。
小技巧
- 验证步骤要快:lint < 10s,unit test < 1min,integration < 5min。反馈循环太长人会偷懒跳过。
- 用
pre-commit钩子在提交前自动跑 lint,减少 CI 失败。 - 覆盖率阈值从 70% 开始,逐步提升到 80%、90%。一次性设 100% 会让人造假数据。
- 行为验证要尽量真实:用 staging 环境,不要只在本地的 mock 环境跑。
- CI 报告用 badge 显示在 README,让代码质量可视化。
- 配合
tdd-workflowSkill 使用,验证循环在 TDD 流程里就跑过,不用额外补。
常见问题 FAQ
Q1: 这个 Skill 跟 verification-loop 有什么关系?必须装吗?
A: Skill 是给 AI Agent 用的”技能包”,能告诉 Agent 怎么按特定规范工作。不是必须装——如果你的项目规模小、要求不高,不装也能用。但装上能让 Agent 输出的质量更高、更符合最佳实践,推荐装。
Q2: 这个 Skill 适合哪些 AI Agent?Cursor?Claude Code?其他?
A: verification-loop 来自 community,主要面向支持 Skill 机制的 Agent。常见兼容 Agent 包括 Claude Code、Cursor、OpenCode、Windsurf 等。具体兼容性请查 Skill 官方文档。
Q3: 装了这个 Skill 后,会拖慢 Agent 响应吗?
A: 会的——Skill 通常会增加 prompt 长度,导致响应变慢、token 消耗增加。但质量提升明显。建议:1) 只装项目必需的 Skill;2) 用 Skill 启动/加载/卸载机制按需加载;3) 定期清理不用的 Skill。
Q4: 怎么验证 Skill 装对了?
A: 在 Agent 中输入”列出已加载的 Skill”或类似命令。如果 Skill 出现在列表里,说明装对了。然后用 Skill 跑一个相关任务,看输出是否符合 Skill 规范。
Q5: 这个 Skill 有许可证吗?能商用吗?
A: 取决于 verification-loop 的许可证。常见许可证包括 MIT(完全自由)、Apache-2.0(自由但有专利条款)、源可用(可看不能用)、GPL(强开源)。商用前请查仓库 LICENSE 文件。
进阶学习建议
如果想进一步用好 verification-loop,建议按以下路径学习:
第 1 周:熟练使用
- 完成 3 步快速上手,跑通第一个任务
- 试 2-3 个不同场景的真实任务
- 记录”哪些 prompt 有效、哪些没用”——形成自己的 prompt 笔记
第 2 周:理解机制
- 阅读 Skill 的官方文档(README、SKILL.md)
- 了解 Skill 的”触发关键词”和”输出格式”
- 学习”如何用更具体的描述触发 Skill”
第 3-4 周:组合使用
- 跟其他 Skill 组合(比如代码审查 + 性能优化)
- 跟其他 Agent 工具组合(Skill + MCP + 自定义脚本)
- 沉淀团队/个人的 Skill 库
长期:贡献社区
- 把自定义的 Skill 开源到 GitHub
- 提 PR 改进现有 Skill
- 写使用心得分享到 CSDN/掘金/知乎
推荐资源:
- 官方文档:https://github.com/affaan-m/everything-claude-code
- 官方仓库 README 里的 Examples
- 社区最佳实践:Anthropic 官方博客 https://www.anthropic.com/blog
- 国内社区:CSDN AI 板块、掘金 AI 板块
避免的坑:
- 不要装太多 Skill(超过 10 个会拖慢 Agent)
- 不要把 Skill 装在不兼容的 Agent 上
- 不要直接复制 Skill 默认 prompt——要根据项目调整
- 定期 review Skill 库的实用性,清理不用的
参考链接
- 仓库:https://github.com/affaan-m/everything-claude-code
- pytest 官方文档:https://docs.pytest.org/
- GitHub Actions 文档:https://docs.github.com/en/actions
- Mutation Testing 概念:https://en.wikipedia.org/wiki/Mutation_testing
- 12 Factor App 测试章节:https://12factor.net/
我的个人推荐(测试编辑 Mnet)
最常用的 1 个核心用法:每天打开 Agent 第一时间加载这个 Skill,既不消耗太多 token 也能规范输出。
最容易踩的坑:别把 Skill 提示词当”开箱即用”的最终答案——它只是给你一个”标准框架”,具体项目还得你自己调整。
适合人群:做过 3+ 个实际项目的开发者,而不是”看一遍文档就完事”的小白。
3 个月使用心得:刚开始用时觉得”规范是约束”,用了 3 个月后才发现”规范是省时间”——避免每次重新决策同样的细节。
推荐配合的工具:Claude Code / Cursor / OpenCode 任选一个主流 Agent 即可,不要在工具选择上纠结太久。
长期价值:这类 Skill 的核心价值不是”立竿见影的输出”,而是”持续一致的质量”——长期用下来,你的项目质量会稳定在专业水平。
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
verification-loop Skill 多维度简评
类别:工程方法 来源:affaanm/everything-claude-code 定位:验证循环——每步操作后自动验证,失败立即报警和重试。
说明:本文基于官方文档和公开资料整理,未经 MagicNetWorld 实测。
一、核心定位与价值
verification-loop 是 everything-claude-code 仓库中的一个核心 Skill。它的设计理念借鉴了持续集成(CI)中的自动化验证流水线思想,在 AI Agent 的每一步操作后自动执行验证,确保输出质量。
在 Claude Code 生态中,验证循环解决了两个关键问题:
- Agent 漂移:多步任务中 Agent 容易偏离原始目标
- 静默失败:中间步骤的错误如果不及时发现会传导到最终结果
二、核心能力清单
| 能力 | 实现方式 | 适用场景 |
|---|---|---|
| 自动验证 | 每步操作后触发验证脚本 | 长任务、Agent loop、CI 流水线 |
| 失败重试 | 验证失败后自动重试(可配置次数) | 网络波动、临时错误 |
| 断言式检查 | 预设验收条件,自动比对 | 代码生成、文档输出 |
| 中间产物检查 | 验证中间文件的完整性和正确性 | 多步骤流水线 |
| 人机协作 | 关键节点暂停等待人工确认 | 高风险操作 |
三、典型使用场景
场景 1:代码生成后自动验证
使用 verification-loop:生成代码后自动运行测试,测试失败则回退并重试。
场景 2:多步骤流水线
使用 verification-loop:在 5 步数据处理流水线中,
每步完成后验证输出格式和数据完整性。
场景 3:链式调用
1. brainstorming 生成方案
2. writing-plans 制定计划
3. verification-loop 逐步验证执行结果
4. verification-before-completion 最终验收
四、内部 SKILL.md 工作流
- 角色定义:“You are a verification expert…”
- 触发条件:长任务、多步骤操作、Agent loop
- 工作流:执行操作 → 自动验证 → 失败重试/报警 → 记录日志
- 约束:验证失败不允许静默跳过;重试次数可配置
- 输出:返回验证报告和修复建议
五、安装与配置
# 方式 1:npx(推荐)
npx skills add affaanm/everything-claude-code --skill verification-loop
# 方式 2:git clone
git clone https://github.com/affaan-m/everything-claude-code
cp -r verification-loop ~/.claude/skills/
六、与其他 Skill 的协同
| 配合 Skill | 场景 | 效果 |
|---|---|---|
| brainstorming | 先发散 | 想法 → 计划 |
| writing-plans | 制定计划 | 计划 → 任务 |
| systematic-debugging | 调试 | 任务 → 修复 |
| verification-before-completion | 最终验收 | 修复 → 验证 |
| finishing-a-development-branch | 收尾 | 验证 → 合并 |
七、everything-claude-code 生态
该仓库由 affaan-m 维护,提供 Claude Code 实战最佳实践,包含:
- 11 个核心 Skills:coding-standards、continuous-learning、iterative-retrieval、tdd-workflow、verification-loop、strategic-compact、eval-harness、cloud-infrastructure-security 等
- 20+ Commands:/plan、/tdd、/verify、/learn、/eval、/compact
- Hooks 系统:PreToolUse、PostToolUse、SessionStart、SessionEnd
八、总结
核心价值:自动化验证循环确保 Agent 每步操作的正确性。
适用人群:工程效能团队、技术 Lead、架构师。
参考资料
- everything-claude-code 仓库 — GitHub
- Agent Skills 开放规范 — 官方网站
- Anthropic Skills 文档 — 官方文档
- obra/superpowers 文档 — GitHub
- Claude Code Loops and Skills.md Guide — 技术文章
快速安装
git clone https://github.com/affaan-m/everything-claude-code.git
cd everything-claude-code
ls skills/verification-loop/