本文字数:4496 字,阅读约需 15 分钟。
2023年到2024年是"Prompt工程"的黄金时期。到了2025年底,AI圈开始频繁讨论一个新概念——Skills(技能)。
GitHub上Skills相关仓库获得上万star,各行各业的专业人士开始分享自己封装的Skills。Skills到底是什么?它为什么能引发如此关注?
Agent Skills是模块化的能力包,包含指令、元数据和可选资源(脚本、模板),让AI Agent在需要时自动加载和使用。
Skills就像AI助手的"工作手册库"。它不是每次对话都要重新输入的临时指令,而是一套可以长期保存、随时调用的能力模块。
要理解Skills,先看传统AI交互的问题。
想象你在公司带一个新人。他聪明、理解能力强,但不熟悉规矩。
Skills改变了这一局面。它就像给新人一本完整的公司内部SOP手册——不是长到让人窒息的Word文档,而是一个知识库文件夹,里面有规范、脚本、模板、参考资料。AI会在需要时自己翻阅,按需加载。
很多人问:"这不就是Prompt吗?"实际上两者在形态上有本质区别:
一个标准的Skill目录:
skill-name/
├── SKILL.md # 核心指令文件(必需)
├── scripts/ # 可执行脚本(可选)
├── references/ # 参考文档(可选)
├── templates/ # 模板文件(可选)
└── assets/ # 其他资源(可选)

Skills标准目录结构
SKILL.md是唯一必需的文件,它采用YAML前导格式(类似简历开头的个人信息区),包含元数据和详细指令。这种设计让Skills不仅能承载知识,还能承载工具和流程。
Skills采用了渐进式披露(Progressive Disclosure)架构。这个概念在移动互联网时代曾是用户体验设计的核心原则之一。
打开一个APP,如果它一次性把所有功能、设置、选项都堆在你面前,你会怎样?认知负荷爆炸,不知所措。
人的瞬时记忆区非常有限,一瞬间只能接受最多7±2个信息块。AI也是如此——受限于Token窗口,对话越长,模型越"笨"。Token在Agent架构上寸土寸金。
传统做法:每次对话都把完整指令塞进上下文。一个详细的PDF处理工作流可能需要3000+ tokens。如果同时处理Excel、写代码、生成报告,上下文窗口很快爆满。
Skills通过三层渐进式加载解决这个问题:
第一层:元数据——目录索引
这是Skills的"封面",包含技能名称和一句话描述。
你可以安装数十个Skills,几乎没有性能损失。AI就像看图书馆的目录,知道有哪些书,但不必都翻开。
第二层:指令——详细手册
当AI通过元数据判断某个任务需要特定Skill时,它会读取完整的SKILL.md文件。
用户说"帮我处理这个PDF",AI会判断匹配PDF Skill,然后加载详细的处理流程:先提取文本,再识别表单字段,最后填写并保存。
第三层:资源和代码——深度参考
这层包括参考文档、可执行脚本、模板文件等。
一个包含复杂Python脚本的Skill,脚本本身的代码不会进入上下文,只有执行结果会返回。这让Skills可以承载几乎无限的资源,而不必担心Token限制。

Skills三层渐进式加载架构
以PDF处理为例,看Skills如何工作:
阶段1:初始状态
用户输入:"用PDF技能填写这份合同"
系统提示 + 技能目录 + 用户消息
Token消耗:约100 tokens
阶段2:加载主手册
AI判断:这个任务匹配PDF Skill
执行:bash cat ~/.claude/skills/pdf/SKILL.md
Token消耗:+3000 tokens
阶段3:按需加载参考资料
AI判断:需要表单填写规则
执行:bash cat ~/.claude/skills/pdf/references/forms.md
Token消耗:+500 tokens
阶段4:执行脚本
执行:python scripts/fill_form.py --input contract.pdf --output filled.pdf
Token消耗:+200 tokens(仅输出结果)
总Token消耗:约3800 tokens。
对比传统方式:一次性加载所有相关文档和脚本定义,可能需要10,000+ tokens。Skills节省了60-70%的上下文空间。

Skills加载流程示意图
Skills、MCP、Prompt不是竞争关系,而是互补关系:
维度 | Skills | MCP | Prompt |
|---|---|---|---|
核心定位 | 工作流程指南(How) | 外部系统连接(What) | 临时指令 |
解决问题 | 如何使用能力 | 提供什么数据/能力 | 当下做什么 |
形象比喻 | 使用说明书 | 工具箱 | 口头指令 |
Token效率 | 高(渐进加载) | 低(全量加载) | 中(每次重复) |
复用性 | 强(文件系统) | 中(协议层面) | 弱(手动复制) |

Skills vs MCP vs Prompt对比图
Skills解决"怎么做"(方法论/工作流),MCP解决"连到哪儿"(连接外部系统)。
用职场类比:
一个组合场景:
生成销售报告
MCP解决"能访问什么数据",Skills解决"如何使用这些数据生成报告"。

Skills与MCP协作关系
Skills不就是高级一点的Prompt吗?
答案既是肯定的,也是否定的。
相同点:Skills的核心确实是自然语言指令,这与Prompt一致。
根本区别:
用一个实际例子:
没有Skills时,每次都要说:
帮我总结这篇文章 → 翻译成英文 → 改成公众号风格 → 加标题 → 输出Markdown格式
有了Skills后,只需要一句:
使用「技术文章转公众号」Skill
AI会自动按照预设的完整流程执行。
案例1:AI选题系统
一个内容团队用Skills构建了自动化选题系统,包含:
每天只需要一句:"开始今日选题生成",系统就会自动:
过去需要2-3小时的工作,现在几分钟就能完成初筛。
案例2:整合包生成器
很多GitHub开源项目没有前端界面,环境配置复杂。有人用Skills做了一个"整合包生成器":
提供一个GitHub链接,Skill就会:
解决了"想用但不会配置"的痛点。
传统方式的问题:
Skills带来的改变:
组织架构示例:
公司级Agent产品
├── 市场部维护:品牌文案Skill
├── 法务部维护:合同审阅Skill
├── 财务部维护:报销审核Skill
└── 技术部维护:代码审查Skill
所有技能装在同一个Agent身上,用户只跟一个界面打交道。
医疗诊断流程:将诊断标准、注意事项、药物禁忌等封装成Skill,确保AI遵循医疗规范
法律文书审查:将审查要点、风险识别、合规要求标准化,提高审查质量和一致性
代码审计规范:将安全检查项、代码风格要求、最佳实践固化
ML实验配置:将实验设计规范、参数推荐范围、结果记录模板封装
这些领域知识需要结构化存储、团队共享、版本管理、跨平台使用——正是Skills的强项。
创建一个Skill只需要一个SKILL.md文件:
---
name: hello-skill
description: A simple skill that greets users
---
# Hello Skill
When user says hello, respond with a friendly greeting.
必填字段:
name:技能名称(小写字母、数字、连字符符)。description:功能描述。简单到人人可创建,强大到专业团队可用。
pdf-skill/
├── SKILL.md
├── scripts/
│ ├── extract_text.py
│ ├── fill_form.py
│ └── merge_pdfs.py
├── references/
│ ├── FORMS.md
│ └── API_REFERENCE.md
└── templates/
└── report_template.md
SKILL.md内容:
---
name: pdf-processing
description: Extract text and tables from PDF files, fill forms, merge documents.
Use when working with PDF files or when the user mentions PDFs.
---
# PDF Processing
## Quick Start
1. For text extraction, use `python {baseDir}/scripts/extract_text.py`
2. For form filling, see [FORMS.md](references/FORMS.md)
3. For merging PDFs, execute the merge script
## Supported Operations
- Text extraction from text-based PDFs
- OCR for scanned PDFs (requires Tesseract)
- Form field identification and filling
- Multi-document merging
## Best Practices
- Always validate PDF integrity before processing
- Use OCR only when necessary (higher token cost)
- Keep extracted text under 10,000 tokens for best performance
关键点:
{baseDir}是自动替换变量,表示Skill的安装路径。方法1:命令安装
# 安装官方Skill
claude skill install https://github.com/anthropics/skills/tree/main/skills/pdf
# 或在对话中直接说
"安装这个skill:https://github.com/xxx/skill-name"
方法2:手动放置
将Skill文件夹放到对应目录:
~/.claude/skills/。~/.cursor/skills/。~/.config/opencode/skill/。使用方式:
直接对话:
用户:"帮我处理这个PDF"
AI会自动识别并调用PDF Skill
或者显式指定:
用户:"使用PDF Skill提取这份文档的文本"
目前Skills还处于早期阶段,但已经有了生态雏形:
Skills也面临挑战:
Skills代表一个重要趋势:**从让AI"理解"到让AI"执行"**。
过去几年,我们主要关注如何让AI更好地理解自然语言、理解上下文、理解意图。这是必要的基础,但还不够。
Skills的出现,标志着我们开始关注如何让AI系统地、可重复地、高质量地执行复杂任务。这不仅需要理解能力,还需要方法论、最佳实践、工具链的支持。
这是AI从"对话伙伴"进化为"工作伙伴"的关键一步。
Skills的热度已不亚于当年的Prompts。但这不只是流行趋势,而是实实在在的生产力革命。
如果你还在犹豫是否要尝试Skills,建议从最简单的开始:
今天,安装一个官方Skill(比如skill-creator),感受一下"一个命令安装能力"的便捷。
明天,把最常用的一个动作固化成Skill——比如选题筛热点、报错日志分析、链接摘要生成。
后天,你会想把更多工作流程都搬进去。
到那一步,你就进入了另一个状态:自由,创造的状态。
Skills的核心价值,在于复用。当你把一次性的努力转化为可重复调用的能力,你就不再是每次都从零开始,而是站在前人的肩膀上持续前进。
都看到这里了,如果觉得有帮助,还请您给我个小小的鼓励,动动手指,帮忙点个在看或者点个赞👍🏻!谢谢喽!!!
关注我,持续分享后端开发经验!