caveman — 极简输出模式,Token 直降 65%
Matt Pocock 出品,开启后 AI 砍掉所有废话只保留干货,实测输出 Token 从 1214 降到 294,节省 65% API 费用。
评分明细
适用场景
caveman 快速入门
一键让 AI 进入”原始人模式”:少废话、多给代码,Token 账单立省 65%。
这是什么?解决什么问题?
用 AI 编程久了,容易发现一个规律:模型越”礼貌”越费钱。“当然可以!我非常乐意帮你!下面是一个完整的示例……”——这种客套话每一轮都要吃几十到几百 token,长期下来 API 账单里”客套”占比能到 30% 以上。
caveman 是英国 TypeScript 教育者 Matt Pocock 出品的一个超轻量 Skill,核心就一条规则:输出用最少的字。
- 不写”好的,以下是……”
- 不写”希望这对你有帮助”
- 不解释背景,除非被问
- 代码块能合并就合并
- 输出格式尽量”电报体”
Matt 本人在仓库里给的对比数据非常直白:同样一个任务,常规模式输出 1214 token,caveman 模式只输出 294 token,直接腰斩到原来的四分之一,适合”我已经知道想做什么,只是想要执行”的高频日常。
适合人群:每天用 AI 写大量代码的人、给团队开 API 账户想省成本的技术 Leader、刷算法题/做 Code Review 的人。
准备工作
- 一个支持 SKILL.md 的 agent
- 5 分钟时间
- (可选)准备一个能看 token 用量的工具,如 Claude Code 自带的
/cost命令
3 步快速上手
第 1 步:克隆并软链
git clone https://github.com/mattpocock/skills.git
ln -sf "$(pwd)/skills/caveman" ~/.claude/skills/caveman
OpenCode 用户把目标路径改为 ~/.config/opencode/skills/,Cursor 用户改为 ~/.cursor/skills/。
第 2 步:确认 Skill 已加载
ls ~/.claude/skills/caveman/SKILL.md
cat ~/.claude/skills/caveman/SKILL.md
可以看到 SKILL.md 极短(整个文件不到 1KB),核心就是那几条”电报体”规则。重启 agent,跑 /skills list 看到 caveman 即 OK。
第 3 步:对比”开启前 / 开启后”的输出
第 1 次:不开 caveman
帮我写一个把数组按奇偶分组的 TypeScript 函数。
观察 AI 输出:大概率 200+ token,前 1/3 是”好的,这是……”等客套。
第 2 次:开 caveman
[用 caveman]
帮我写一个把数组按奇偶分组的 TypeScript 函数。
观察 AI 输出:通常 < 80 token,直接给代码,可能有 1 行简短解释。
算账:同一个 prompt 反复 100 次,开 caveman 一周能省 1 万-3 万 token,按 Sonnet 价位算大概能省一杯咖啡钱到一顿午饭钱,长期可观。
常见踩坑
- 所有场景都开 caveman:写正式文档、做客户演示、给新人解释概念,千万别开 caveman,客套和解释是有用的。只在”我已经知道我要啥”的场景开。
- 同事看不懂 caveman 输出:如果你是 Tech Lead,直接给团队推广要注意”可读性下降”,建议只在 Code Review、生成测试、重构这类个人高密度场景使用。
- 复杂任务 caveman 会出 bug:任务越复杂,模型越需要”解释思路”,否则可能给出错误代码。开 caveman 时尽量把任务拆小,每个子任务独立完成。
- 想关掉时怎么关:SKILL.md 是被动加载,你直接换一个不带
[用 caveman]前缀的提问,模型就回到默认风格;也可以/skills disable caveman临时关。 - “电报体”被部分场景嫌弃:如果对接的是 LLM-as-Judge 评测(模型打分自己的输出),caveman 风格有时反而得低分,因为解释不够清楚,自动化评测场景慎用。
- 与”长输出 Skill”冲突:如果你同时启用了”详细日志”类 Skill,caveman 可能会被覆盖,要分场景使用。
初级用法
- 刷算法题:每题用 caveman 模式出解法,30 分钟 10 题,token 用量可控。
- 批量改字段名:让 AI 把一个文件里 20 个变量从
userId改userID,caveman 模式不会画蛇添足加注释。
高级玩法
- 配合 cost-tracker Skill:把 caveman 的输出接给一个 token 计数器,长期跟踪”省了多少 token”,每月给老板出报告。
- 场景化 Prompt 模板:把”开 caveman”和”不开”做成两个 prompt 模板,日常写代码用 caveman 版、写 README 用普通版,自动选择。
- CI 中的 AI 评审:PR 自动化评审流程里全程 caveman,既快又省。
小技巧
- caveman 输出短,出错时少给上下文,可以追问”再解释下”临时切回详细模式。
- 用”罗列选项”代替”完整段落”,AI 会优先输出短答案。
- 表格比段落省 token,如果答案可以表格式,主动说”用表格回答”。
- 一次只让 AI 做一件事,caveman 模式不喜欢”顺便……”。
- 自己写代码注释时也学 caveman 风格,简洁到极致,长期能训练出更好的”AI prompt 直觉”。
常见问题 FAQ
Q1: caveman 适合哪些编程语言?
A: caveman 通常支持主流编程语言(Python、JavaScript/TypeScript、Java、Go、C++、Rust 等)。支持程度因语言而异:Python/JavaScript/TypeScript 最佳,小众语言(如 Haskell、Elixir)可能较弱。
Q2: caveman 生成的代码可以直接用吗?
A: 简单的 CRUD、工具函数、单元测试可以直接用;复杂的业务逻辑、算法实现需要人工 review。永远不要盲目复制 AI 生成的代码——先理解再使用。
Q3: caveman 怎么收费?
A: 通常分免费版(基础功能,有限次数)、付费版(高级模型、无限次数、团队协作)。个人开发者 Pro 版约 $10-20/月,企业版 $30-50/用户/月。具体以 https://github.com/mattpocock/skills 定价为准。
Q4: caveman 会上传我的代码到云端吗?有隐私问题吗?
A: 大部分 AI 编程工具会保存你的代码用于服务提供(模型推理)和模型改进(除非关闭)。敏感代码(企业核心、商业秘密)建议:1) 使用本地部署版本;2) 关闭”使用我的代码改进模型”选项;3) 考虑企业版(有更强隐私保护)。
Q5: 怎么让 caveman 生成更高质量的代码?
A: 关键技巧:1) 写清晰的 prompt,说明输入输出和约束;2) 提供代码示例(让 AI 学习你的风格);3) 拆分任务,不要一次生成太多;4) 用 TODO 注释让 AI 补充具体实现;5) review + 单元测试保证质量。
进阶学习建议
如果想进一步用好 caveman,建议按以下路径学习:
第 1 周:熟练使用
- 完成 3 步快速上手,跑通第一个任务
- 试 2-3 个不同场景的真实任务
- 记录”哪些 prompt 有效、哪些没用”——形成自己的 prompt 笔记
第 2 周:理解机制
- 阅读 Skill 的官方文档(README、SKILL.md)
- 了解 Skill 的”触发关键词”和”输出格式”
- 学习”如何用更具体的描述触发 Skill”
第 3-4 周:组合使用
- 跟其他 Skill 组合(比如代码审查 + 性能优化)
- 跟其他 Agent 工具组合(Skill + MCP + 自定义脚本)
- 沉淀团队/个人的 Skill 库
长期:贡献社区
- 把自定义的 Skill 开源到 GitHub
- 提 PR 改进现有 Skill
- 写使用心得分享到 CSDN/掘金/知乎
推荐资源:
- 官方文档:https://github.com/mattpocock/skills
- 官方仓库 README 里的 Examples
- 社区最佳实践:Anthropic 官方博客 https://www.anthropic.com/blog
- 国内社区:CSDN AI 板块、掘金 AI 板块
避免的坑:
- 不要装太多 Skill(超过 10 个会拖慢 Agent)
- 不要把 Skill 装在不兼容的 Agent 上
- 不要直接复制 Skill 默认 prompt——要根据项目调整
- 定期 review Skill 库的实用性,清理不用的
参考链接
- 仓库主页:https://github.com/mattpocock/skills
- Matt Pocock 个人站:https://www.mattpocock.com/
- Token 计数工具:tiktoken
- Claude API 定价:https://docs.claude.com/en/docs/about-claude/pricing
- OpenAI Tokenizer:https://platform.openai.com/tokenizer
- 相关 Skill:tdd、diagnose、grill-me
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
基本信息
| 项目 | 详情 |
|---|---|
| 来源仓库 | mattpocock/skills |
| 作者 | Matt Pocock |
| Stars | 68,000+ |
| 协议 | MIT |
| 适用工具 | 所有支持 Skills 的工具 |
安装
npx skills@latest add mattpocock/skills
# 选 caveman
# 或手动
git clone https://github.com/mattpocock/skills.git
cp -r skills/skills/productivity/caveman ~/.claude/skills/
安装后 /caveman 开启,再打一次关闭。
这个 Skill 解决什么问题?
AI 回复太啰嗦是高频痛点。解释问题背景、重复你的需求、客套话、不请自来的建议——这些不是错误,但在日常高频使用中是巨大的 Token 浪费。
caveman 砍掉所有这些,只留干货。
实测对比
| 正常模式 | caveman 模式 | |
|---|---|---|
| 平均输出 Token | ~1,214 | ~294 |
| 废话率 | 高 | 接近零 |
| 技术准确性 | 正常 | 不变 |
| 推理质量 | 正常 | 不变 |
🔑 关键:caveman 只影响输出 Token,思考/推理 Token 完全不动。大脑没变小,嘴巴变小了。
使用场景
- 每天高频使用,默认开启
- 简单问题:“这个错误怎么修”→ 直接给方案
- 连续开发时:减少阅读 AI 回复的时间
- 省 API 费用:输出 Token 比输入 Token 贵
深度体验
这个 Skill 的巧妙之处:它不是简单地加一句”请简洁回答”,而是系统性地定义了什么是废话:
- 砍掉冠词(the, a)
- 砍掉客套(“当然,我来帮你…”)
- 砍掉问题复述(“你问的是 XXX,答案是…”)
- 砍掉不请自来的建议(“另外你还可以考虑…”)
- 砍掉收尾语(“如果还有其他问题请随时…”)
独立测试验证,11 个真实开发任务中,caveman 始终将输出压缩到 300 tokens 以内。
与其他 Skills 组合
日常默认开启 caveman
需要详细解释时临时关闭
遇到 Bug → /diagnose(结构化调试,不需要 caveman 干扰)
参考资料
快速安装
git clone https://github.com/mattpocock/skills.git
ln -sf "$(pwd)/skills/caveman" ~/.claude/skills/caveman