📚 工程方法全难度 📦 community

verification-loop

实现后强制验证循环，确保行为正确。

8.7 /10 ★★★★☆

📅 2026-06-15 · 🕒 5 分钟阅读 · 最后更新 2026-06-15 · 来源: community · 分析测评

#verification#loop#safety

📄 相关文章

📊 评分明细

⚡ 功能完备度

8.7 核心功能齐全

🎯 易用性

8.4 安装即用

🔧 可扩展性

9 支持定制和 fork

🔗 生态协同

8.6 可链式调用

🛡️ 稳定性

9.3 CI 集成验证

🎯 适用场景

verificationloopsafety

verification-loop 快速入门

“代码写完了”不算完,必须验证它真的能跑、真的对。

这是什么?解决什么问题?

每个开发者都经历过这种场景:代码写完,信心满满提 PR,CI 一跑——红了。然后发现某个边界条件没考虑到、某个依赖没装、某个测试用例过时了。如果 PR 已经合并到主分支,后果可能是线上事故。

verification-loop Skill 把”实现后验证”流程自动化。它强制 AI 在每个功能实现后,做完整验证循环:

静态检查:lint、type check、format 都能跑过
单元测试:核心逻辑覆盖
集成测试:模块间交互正确
行为验证:实际运行,确认输出符合预期
持续 CI:每次提交都跑,不留未验证代码

这个 Skill 来自 affaan-m 的 everything-claude-code 仓库,GitHub 16k+ stars,核心思想是”防漏测”:任何代码没有通过完整验证循环前,都不算完成。

准备工作

项目的测试框架已配置(Jest、pytest、Go test 等)
CI 已配置(GitHub Actions、GitLab CI 等)
支持 Agent Skill 的 AI 客户端
基本的命令运行能力
至少 20 分钟时间

3 步快速上手

第 1 步:克隆仓库

git clone https://github.com/affaan-m/everything-claude-code.git
cd everything-claude-code
ls skills/verification-loop/

你会看到 SKILL.md、验证脚本模板、CI 配置示例。

第 2 步:加载 Skill

claude --skill verification-loop

第 3 步:让 AI 帮你完成验证循环

实现一个功能后,告诉 AI:

“我刚实现了订单取消接口(src/api/orders.py::cancel_order),请按 verification-loop 帮我做完整验证。”

AI 会按顺序跑完:

[STEP 1: 静态检查]
  - ruff check src/api/orders.py → 通过
  - mypy src/api/orders.py → 通过

[STEP 2: 单元测试]
  - pytest tests/api/test_orders.py::test_cancel_order → 通过
  - 覆盖率:95% (>= 80% 阈值) ✓

[STEP 3: 集成测试]
  - pytest tests/integration/test_order_flow.py → 通过

[STEP 4: 行为验证]
  启动服务并调用接口:
  - curl POST /api/v1/orders/123/cancel -H "Auth: ..."
  - 响应: {"status": "cancelled", "refund_id": "ref_..."}
  - 数据库检查:订单状态确实是 cancelled ✓
  - 边界:取消已发货的订单 → 正确返回 422 ✓
  - 边界:取消不存在的订单 → 正确返回 404 ✓

[STEP 5: 持续 CI]
  - GitHub Actions 配置: lint + test + e2e
  - 每次 push 自动跑
  - 报告生成:badge.svg 可嵌入 README

[结论] 所有验证通过,可以合并

常见踩坑

只跑测试,不跑 lint/type:测试通过不代表代码可维护。Skill 强制全跑。
测试覆盖率造假:写一堆只调一行代码的测试,覆盖率虚高。Skill 会看测试质量。
跳过集成测试:单元测试过了但服务起不来,集成测试能发现这类问题。Skill 强制要求。
行为验证不真实:用 mock 假数据验证,和真实环境差异大。Skill 强调端到端验证。
CI 配置不更新:本地能跑、CI 跑不起来,通常是依赖或环境差异。Skill 会把 CI 步骤和本地步骤对齐。
没验证边界条件:只验证 happy path,异常路径没测。Skill 强调边界用例。

初级用法

每个 PR 跑一遍:实现新功能后,用 Skill 跑完整验证,有问题立刻改。
Bug 修复后回归:修完 Bug 不仅要测试这个分支,还要测试相关功能没退化。
代码重构后:重构不改行为,但要确认行为真的没改。Skill 帮你做这事。

高级玩法

集成 mutation testing:故意改坏代码,看测试能不能抓到。Skill 支持 Stryker(mutatest 等工具。
Performance regression:不仅验证功能正确,还验证性能不退步。Skill 支持基准测试。
Contract testing:对 API 消费者做契约测试,确保 API 变更不破坏下游。

小技巧

验证步骤要快:lint < 10s,unit test < 1min,integration < 5min。反馈循环太长人会偷懒跳过。
用 pre-commit 钩子在提交前自动跑 lint,减少 CI 失败。
覆盖率阈值从 70% 开始,逐步提升到 80%、90%。一次性设 100% 会让人造假数据。
行为验证要尽量真实:用 staging 环境,不要只在本地的 mock 环境跑。
CI 报告用 badge 显示在 README,让代码质量可视化。
配合 tdd-workflow Skill 使用,验证循环在 TDD 流程里就跑过,不用额外补。

常见问题 FAQ

Q1: 这个 Skill 跟 verification-loop 有什么关系?必须装吗?

A: Skill 是给 AI Agent 用的”技能包”,能告诉 Agent 怎么按特定规范工作。不是必须装——如果你的项目规模小、要求不高,不装也能用。但装上能让 Agent 输出的质量更高、更符合最佳实践,推荐装。

Q2: 这个 Skill 适合哪些 AI Agent?Cursor?Claude Code?其他?

A: verification-loop 来自 community,主要面向支持 Skill 机制的 Agent。常见兼容 Agent 包括 Claude Code、Cursor、OpenCode、Windsurf 等。具体兼容性请查 Skill 官方文档。

Q3: 装了这个 Skill 后,会拖慢 Agent 响应吗?

A: 会的——Skill 通常会增加 prompt 长度,导致响应变慢、token 消耗增加。但质量提升明显。建议:1) 只装项目必需的 Skill;2) 用 Skill 启动/加载/卸载机制按需加载;3) 定期清理不用的 Skill。

Q4: 怎么验证 Skill 装对了?

A: 在 Agent 中输入”列出已加载的 Skill”或类似命令。如果 Skill 出现在列表里,说明装对了。然后用 Skill 跑一个相关任务,看输出是否符合 Skill 规范。

Q5: 这个 Skill 有许可证吗?能商用吗?

A: 取决于 verification-loop 的许可证。常见许可证包括 MIT(完全自由)、Apache-2.0(自由但有专利条款)、源可用(可看不能用)、GPL(强开源)。商用前请查仓库 LICENSE 文件。

进阶学习建议

如果想进一步用好 verification-loop,建议按以下路径学习:

第 1 周:熟练使用

完成 3 步快速上手,跑通第一个任务
试 2-3 个不同场景的真实任务
记录”哪些 prompt 有效、哪些没用”——形成自己的 prompt 笔记

第 2 周:理解机制

阅读 Skill 的官方文档(README、SKILL.md)
了解 Skill 的”触发关键词”和”输出格式”
学习”如何用更具体的描述触发 Skill”

第 3-4 周:组合使用

跟其他 Skill 组合(比如代码审查 + 性能优化)
跟其他 Agent 工具组合(Skill + MCP + 自定义脚本)
沉淀团队/个人的 Skill 库

长期:贡献社区

把自定义的 Skill 开源到 GitHub
提 PR 改进现有 Skill
写使用心得分享到 CSDN/掘金/知乎

推荐资源:

官方文档:https://github.com/affaan-m/everything-claude-code
官方仓库 README 里的 Examples
社区最佳实践:Anthropic 官方博客 https://www.anthropic.com/blog
国内社区:CSDN AI 板块、掘金 AI 板块

避免的坑:

不要装太多 Skill(超过 10 个会拖慢 Agent)
不要把 Skill 装在不兼容的 Agent 上
不要直接复制 Skill 默认 prompt——要根据项目调整
定期 review Skill 库的实用性,清理不用的

参考链接

仓库:https://github.com/affaan-m/everything-claude-code
pytest 官方文档:https://docs.pytest.org/
GitHub Actions 文档:https://docs.github.com/en/actions
Mutation Testing 概念:https://en.wikipedia.org/wiki/Mutation_testing
12 Factor App 测试章节:https://12factor.net/

我的个人推荐(测试编辑 Mnet)

最常用的 1 个核心用法:每天打开 Agent 第一时间加载这个 Skill,既不消耗太多 token 也能规范输出。

最容易踩的坑:别把 Skill 提示词当”开箱即用”的最终答案——它只是给你一个”标准框架”,具体项目还得你自己调整。

适合人群:做过 3+ 个实际项目的开发者,而不是”看一遍文档就完事”的小白。

3 个月使用心得:刚开始用时觉得”规范是约束”,用了 3 个月后才发现”规范是省时间”——避免每次重新决策同样的细节。

推荐配合的工具:Claude Code / Cursor / OpenCode 任选一个主流 Agent 即可,不要在工具选择上纠结太久。

长期价值:这类 Skill 的核心价值不是”立竿见影的输出”,而是”持续一致的质量”——长期用下来,你的项目质量会稳定在专业水平。

本文基于官方文档和公开资料整理，AI辅助生成，MagicNetWorld 尚未完成独立实测。如有错误或过时信息，请通过 contact@magicnetworld.com 反馈。

verification-loop Skill 多维度简评

类别：工程方法来源：affaanm/everything-claude-code 定位：验证循环——每步操作后自动验证，失败立即报警和重试。

说明：本文基于官方文档和公开资料整理，未经 MagicNetWorld 实测。

一、核心定位与价值

verification-loop 是 everything-claude-code 仓库中的一个核心 Skill。它的设计理念借鉴了持续集成（CI）中的自动化验证流水线思想，在 AI Agent 的每一步操作后自动执行验证，确保输出质量。

在 Claude Code 生态中，验证循环解决了两个关键问题：

Agent 漂移：多步任务中 Agent 容易偏离原始目标
静默失败：中间步骤的错误如果不及时发现会传导到最终结果

二、核心能力清单

能力	实现方式	适用场景
自动验证	每步操作后触发验证脚本	长任务、Agent loop、CI 流水线
失败重试	验证失败后自动重试（可配置次数）	网络波动、临时错误
断言式检查	预设验收条件，自动比对	代码生成、文档输出
中间产物检查	验证中间文件的完整性和正确性	多步骤流水线
人机协作	关键节点暂停等待人工确认	高风险操作

三、典型使用场景

场景 1：代码生成后自动验证

使用 verification-loop：生成代码后自动运行测试，测试失败则回退并重试。

场景 2：多步骤流水线

使用 verification-loop：在 5 步数据处理流水线中，
每步完成后验证输出格式和数据完整性。

场景 3：链式调用

1. brainstorming 生成方案
2. writing-plans 制定计划
3. verification-loop 逐步验证执行结果
4. verification-before-completion 最终验收

四、内部 SKILL.md 工作流

角色定义：“You are a verification expert…”
触发条件：长任务、多步骤操作、Agent loop
工作流：执行操作 → 自动验证 → 失败重试/报警 → 记录日志
约束：验证失败不允许静默跳过；重试次数可配置
输出：返回验证报告和修复建议

五、安装与配置

# 方式 1：npx（推荐）
npx skills add affaanm/everything-claude-code --skill verification-loop

# 方式 2：git clone
git clone https://github.com/affaan-m/everything-claude-code
cp -r verification-loop ~/.claude/skills/

六、与其他 Skill 的协同

配合 Skill	场景	效果
brainstorming	先发散	想法 → 计划
writing-plans	制定计划	计划 → 任务
systematic-debugging	调试	任务 → 修复
verification-before-completion	最终验收	修复 → 验证
finishing-a-development-branch	收尾	验证 → 合并

七、everything-claude-code 生态

该仓库由 affaan-m 维护，提供 Claude Code 实战最佳实践，包含：

11 个核心 Skills：coding-standards、continuous-learning、iterative-retrieval、tdd-workflow、verification-loop、strategic-compact、eval-harness、cloud-infrastructure-security 等
20+ Commands：/plan、/tdd、/verify、/learn、/eval、/compact
Hooks 系统：PreToolUse、PostToolUse、SessionStart、SessionEnd

八、总结

核心价值：自动化验证循环确保 Agent 每步操作的正确性。

适用人群：工程效能团队、技术 Lead、架构师。

参考资料

everything-claude-code 仓库 — GitHub
Agent Skills 开放规范 — 官方网站
Anthropic Skills 文档 — 官方文档
obra/superpowers 文档 — GitHub
Claude Code Loops and Skills.md Guide — 技术文章

📦 快速安装

1 Git Clone

git clone https://github.com/affaan-m/everything-claude-code.git
cd everything-claude-code
ls skills/verification-loop/