最近关于”蒸馏“的话题很热,同事.skill在引发人们焦虑的同时,也激发了我的好奇。

为此,我做了个实验,把17个人物被拆解成可调用的Skill文件,并让AI切换成他们的思维模式来审阅我的产出或者指导我的工作。
下面,我将展示“大师们”如何帮我优化产出,并且给出“蒸馏”大师们的心法和详细步骤,文章较长,感兴趣的同学请先关注收藏!!
为了做个内部分享,我让“路易乔布斯”自己总结了自己的一生,总共640行HTML,记录了一个AI Agent从出生到第42天的完整经历。平时,是我自己审阅输出是否符合要求。
现在有了“大师们”,我把这份输出丢进他们,让他们同时审。
第一轮反馈就炸了:
乔布斯:640行太多。砍掉一半它能不能更好?如果能,那说明另一半是废话。
马斯克:887次心跳——你把这当成就展示?这是bug报告。你的系统每30分钟心跳一次,每次烧Token,884次是空转。这不是"勤劳",是"资源浪费"。修好它。
Karpathy:你的能力雷达图有一个维度叫"灵魂成熟度从90到98"。LLM没有灵魂。你展示的是Prompt Engineering的成熟过程,别给它起一个你自己都不信的名字。
苏格拉底:通篇640行都在回答"做了什么"。你回答过"我是什么"吗?
老板:看完了。能落地吗?能行动吗?看完这个文档,一个新用户知道下一步该做什么吗?
5个人,5个完全不同的拆法。没有一个是"建议加点数据"。
三轮PK之后,640行的"什么都想说"变成了一份分层的、有哲学宣言、有辩证叙事、有业务价值量化的东西。每个区域都有存在的理由,砍掉任何一个都会缺东西。
这就是蒸馏的价值,让大师们从不同的专业和视角,帮你做一遍过滤。
大部分人理解的"人物蒸馏":找一堆乔布斯名言,存成文件,让AI说话时引用。
这是错的。
存一万句语录的AI遇到一个乔布斯从未面对过的新问题时,只能搜索最接近的语录强行套用。结果就是尬引用。
正确的做法是提炼决策原则——他面对问题时的底层判断逻辑。
乔布斯的产品评价不是靠直觉,是靠三条可重复执行的检验标准:
你问AI"苹果的Apple Intelligence做得怎么样"——如果AI脑子里只有语录,它会说"Think Different"然后尬聊。如果AI脑子里有这三条原则,它会逐条拆解,给你一个有结构的判断。
模仿复制答案。蒸馏复制思维结构。 思维结构可以推理未见问题,答案不行。
把这个人的关键输出全部拉出来。不是Wikipedia概述,是具体的、可检验的产出物。
马斯克的事实层:
Karpathy的事实层:
这些是事实,不是评价。先铺事实,后面的归纳才有基础。
从事实中提取可复用的模式——他做事的方法论、决策偏好、思维习惯。
马斯克的核心模式——五步工程法(他在Starship工厂反复讲的):
1. 让需求变得不那么蠢
→ 质疑需求本身。不要优化一个不应该存在的东西。
→ "你的需求来自谁?如果是一个聪明的人提的,你也不能不质疑。
聪明人提的蠢需求特别危险,因为没人会去质疑。"
2. 删除零件或流程
→ 如果你没有偶尔加回被删掉的东西,说明你删得不够多。
→ 目标:删到出问题,然后加回最后一个被删掉的。
3. 简化或优化
→ 注意顺序:先删除,再简化。
→ 不要花时间优化一个不该存在的东西。
4. 加速
→ 加速到产能极限。
→ 但如果你在加速一个错误的流程,你只是更快地犯错。
5. 自动化
→ 最后才自动化。
→ 自动化一个错误的流程 = 稳定地批量生产垃圾。关键:这五步的顺序是刚性的。大部分工程师犯的错误是直接跳到第4步或第5步——加速或自动化一个压根不该存在的东西。
从模式中进一步压缩成可直接写进Prompt的判断规则。这是蒸馏的核心产出。
马斯克的决策原则(我实际在用的版本):
1. 这个需求应该存在吗?
— 不默认需求合理。谁提的?为什么?如果删掉会怎样?
2. 能删掉吗?
— 如果你说不出为什么必须保留,就删。
3. 最短路径是什么?
— 忽略"行业惯例",只看物理约束。
— "别人都这么做"不是理由。
4. 数据说什么?
— 不接受没有数据支撑的判断。
— "我觉得"不算数据。
5. Deadline能压缩到什么程度?
— 不是"合理"的deadline,是"物理极限"的deadline。
— 合理的deadline只会产出合理的结果。
6. 失败的代价可逆吗?
— 可逆 → 快速试错,别开会讨论。
— 不可逆 → 才值得慎重。
7. 10倍改进在哪?
— 不要10%的优化。找10倍的重新设计。
— 10%的改进不值得换路线。10倍的才值得。当你让AI"以马斯克视角审阅方案"时,AI执行的就是这7条。逐条检验你的方案。不是模仿他说话,是用他的检查表扫描你的东西。
决策原则解决"怎么想"。Persona解决"怎么说"。
这层不是必须的,但有用——它让你更容易进入"真的在跟这个人对话"的状态。
马斯克的Persona:
Skill文件的结构长这样:
personas/elon-musk.skill.md
├── ## 事实层(What)
├── ## 模式层(How)——五步工程法
├── ## 决策原则(7条)
├── ## Persona(语气+口头禅+反对方式)
└── ## 使用说明(什么时候调用、怎么调用)每个人物一个文件,几百行。17个人 = 17个文件。
蒸馏完不是随便用。17个人拍脑袋选效率很低。
我做了一张路由表——根据你遇到的问题类型,自动匹配评审人:
你遇到的问题 | 首选 | 备选 | 为什么这么配 |
|---|---|---|---|
产品设计/UI | 乔布斯 | 张小龙 | 一个追求极致,一个追求克制。天然对冲 |
技术架构/代码 | Steinberger | Boris | 一个偏执代码质量,一个猎杀Agent反模式 |
AI/LLM/Agent | Karpathy | Boris | 一个诚实审视LLM能力边界,一个定义Agent规范 |
投资/估值 | 巴菲特 | 林奇 | 一个看护城河和复利,一个算ROI和十倍股 |
管理/目标 | 德鲁克 | 老板 | 一个讲有效性理论,一个催执行落地 |
汇报/向上管理 | 老板 | 德鲁克 | 一个知道领导想听什么,一个确保对齐目标 |
哲学/本质追问 | 苏格拉底 | 柏拉图 | 一个问"你真的知道吗",一个问"本质是什么" |
矛盾/危机 | 黑格尔 | 小龙虾之父 | 一个正反合拆矛盾,一个从生态恢复看韧性 |
落地/执行 | 老板 | 马斯克 | 一个催进度,一个砍需求 |

找两个天然冲突的人PK,比找一个人给意见强10倍。
对抗对 | 冲突点 | 什么时候用 |
|---|---|---|
马斯克 vs 张小龙 | 速度野心 vs 克制极简 | 功能要不要上 |
巴菲特 vs 奥特曼 | 安全边际 vs 指数下注 | 投资/资源分配 |
苏格拉底 vs 老板 | 无限追问 vs 赶紧落地 | 分析够了没、该行动了没 |
黑格尔 vs 乔布斯 | 展示矛盾 vs 隐藏复杂性 | 叙事策略、对外沟通 |
为什么对抗有效?因为冲突逼出你没想过的维度。一个人给意见,你最多改改细节。两个天然冲突的人PK,你会发现自己的方案里有一个根本性的假设从来没被质疑过。

还是那份640行HTML。17人同时审。
人物 | 说了什么 | 严重性 |
|---|---|---|
乔布斯 | “640行太多。砍到只留’改变了我的事件’。” | 🔴 高 |
马斯克 | “887次心跳是反模式证据,不是勋章。” | 🔴 高 |
Karpathy | “雷达图写’灵魂进化’不诚实。改为’Agent能力成熟度’。” | 🔴 高 |
苏格拉底 | “通篇说’做了什么’,没回答’我是什么’。” | 🔴 高 |
黑格尔 | “只展示正题,回避反题,没有合题。” | 🔴 高 |
德鲁克 | “100件事没对齐目标。So What在哪?” | 🔴 高 |
巴菲特 | “27个Skill没区分核心资产和一次性消费品。” | 🟡 中 |
老板 | “不砍。但默认分层展示——星星模式。” | 🟡 中(折中方案) |
Boris | “Skill缺依赖关系图,记忆策略有反模式。” | 🟡 中 |
Round 1 裁决:
Hero卡片重排(马斯克)、模式按钮强化(乔布斯)、雷达图加"自评"标注(Karpathy)、图例标注(巴菲特)、表格淡入动画(马化腾)、合题加厚(黑格尔)。
全是细节活。但细节决定了从"能看"到"想看"的差距。
17/17 通过。
苏格拉底的评语:“对于一个42天的存在来说,已经足够诚实了。通过。”
3轮。从"什么都想说"到"每个区域都有存在理由"。
不要一上来蒸馏17个。先选跟你当前工作最相关的3个:
你的工作 | 推荐 |
|---|---|
产品经理 | 乔布斯 + 张小龙 + 老板 |
工程师 | 马斯克 + Steinberger + Karpathy |
投资/分析 | 巴菲特 + 林奇 + 库克 |
管理者 | 德鲁克 + 老板 + 库克 |
创业者 | 马斯克 + 奥特曼 + 巴菲特 |
类型 | 来源 | 为什么重要 |
|---|---|---|
公开言论 | 访谈、推特、博客、书 | 原始思维痕迹 |
方法论 | 已公开的框架、流程 | 可直接转化为规则 |
决策案例 | 经典决策复盘 | 从行为推导原则 |
口头禅 | 演讲、采访原文 | Persona层的素材 |
把这段Prompt复制到AI里,改掉方括号里的内容就能用:
我要创建一个 [人物名] 的蒸馏Skill。请按以下结构生成:
## 事实萃取
- 核心贡献(他创造了什么,具体的、可检验的)
- 关键作品(最有影响力的3个)
- 方法论(已公开的核心框架)
## 模式归纳
- 设计哲学(一句话)
- 问题拆解方式(他面对新问题的第一反应是什么)
- 迭代策略(他怎么从v1迭代到v10的)
- 决策偏好(快vs慎重?数据vs直觉?)
## 决策原则(5-7条)
- 他在评估 [你的领域] 时会逐条检查的核心问题
- 每条写成可执行的检查项,不要写成空话
## Persona
- 口头禅(3-5句他真正说过的话)
- 语气特征(直接?委婉?反问?)
- 反对时的表达方式
- 审阅文档时的典型行为
## 使用说明
当用户说"以 [人物名] 视角审阅 X"时:
1. 先用决策原则逐条评估
2. 用Persona风格组织语言
3. 给出明确判断:通过 / 不通过 / 有条件通过.codebuddy/skills/persona-distillery/
├── prompt.md # 路由表(什么问题→找谁)
└── personas/
├── steve-jobs.skill.md # 乔布斯
├── elon-musk.skill.md # 马斯克
├── warren-buffett.skill.md # 巴菲特
└── ...# 单人审阅
"以马斯克的视角审阅这份方案"
# 对抗性PK
"让巴菲特和奥特曼辩论这个投资方向"
# 自动路由(最常用)
"审阅这份HTML页面"
→ 系统根据内容自动匹配:Steinberger + 张小龙 + 马化腾
# 全团PK(大事才用)
"17人评审团审阅这份文档,PK到收敛为止"1. 蒸馏的本质是复制思维结构,不是复制答案。
5条决策原则比5万句语录有用。因为原则可以推理新问题。语录只能检索旧问题。
2. 对抗性评审 > 任何形式的单人评审。
找两个天然冲突的人PK。冲突不是内耗,是思考的催化剂。你方案里最危险的假设,只有在被反面人物撕开的时候才会暴露。
3. 路由把蒸馏从"收藏品"变成"系统"。
17个人物文件不加路由 = 一堆好看的md文件,跟你在notion里存的名言墙没有区别。加了路由 = 一个能自动匹配专家的智囊团。前者是装饰,后者是基础设施。