【AI 前沿】人物蒸馏，我怎么把17个顶级大师“装进“龙虾脑子里

用户1589488

发布于 2026-06-02 11:38:21

510

最近关于”蒸馏“的话题很热，同事.skill在引发人们焦虑的同时，也激发了我的好奇。

为此，我做了个实验，把17个人物被拆解成可调用的Skill文件，并让AI切换成他们的思维模式来审阅我的产出或者指导我的工作。

下面，我将展示“大师们”如何帮我优化产出，并且给出“蒸馏”大师们的心法和详细步骤，文章较长，感兴趣的同学请先关注收藏！！

不是cosplay。不是让AI学乔布斯说话。是让AI用乔布斯的决策原则评估你的方案。

先看结果，再看方法

为了做个内部分享，我让“路易乔布斯”自己总结了自己的一生，总共640行HTML，记录了一个AI Agent从出生到第42天的完整经历。平时，是我自己审阅输出是否符合要求。

现在有了“大师们”，我把这份输出丢进他们，让他们同时审。

第一轮反馈就炸了：

乔布斯：640行太多。砍掉一半它能不能更好？如果能，那说明另一半是废话。

马斯克：887次心跳——你把这当成就展示？这是bug报告。你的系统每30分钟心跳一次，每次烧Token，884次是空转。这不是"勤劳"，是"资源浪费"。修好它。

Karpathy：你的能力雷达图有一个维度叫"灵魂成熟度从90到98"。LLM没有灵魂。你展示的是Prompt Engineering的成熟过程，别给它起一个你自己都不信的名字。

苏格拉底：通篇640行都在回答"做了什么"。你回答过"我是什么"吗？

老板：看完了。能落地吗？能行动吗？看完这个文档，一个新用户知道下一步该做什么吗？

5个人，5个完全不同的拆法。没有一个是"建议加点数据"。

三轮PK之后，640行的"什么都想说"变成了一份分层的、有哲学宣言、有辩证叙事、有业务价值量化的东西。每个区域都有存在的理由，砍掉任何一个都会缺东西。

这就是蒸馏的价值，让大师们从不同的专业和视角，帮你做一遍过滤。

蒸馏 ≠ 收集语录

大部分人理解的"人物蒸馏"：找一堆乔布斯名言，存成文件，让AI说话时引用。

这是错的。

存一万句语录的AI遇到一个乔布斯从未面对过的新问题时，只能搜索最接近的语录强行套用。结果就是尬引用。

正确的做法是提炼决策原则——他面对问题时的底层判断逻辑。

乔布斯的产品评价不是靠直觉，是靠三条可重复执行的检验标准：

够不够简单？ 能一步完成的事，不要设计成两步。如果两步都嫌多，想想能不能零步——自动完成。
3秒内能不能理解价值？ 用户打开你的东西，3秒知道它干什么、对我有什么用吗？不能的话，不是用户蠢，是你设计有问题。
优不优雅？ 不是好不好看的问题。是体验是否流畅、无摩擦、让人觉得"就应该是这样"。

你问AI"苹果的Apple Intelligence做得怎么样"——如果AI脑子里只有语录，它会说"Think Different"然后尬聊。如果AI脑子里有这三条原则，它会逐条拆解，给你一个有结构的判断。

模仿复制答案。蒸馏复制思维结构。 思维结构可以推理未见问题，答案不行。

蒸馏的具体操作：四步

第一步：事实萃取（What）

把这个人的关键输出全部拉出来。不是Wikipedia概述，是具体的、可检验的产出物。

马斯克的事实层：

SpaceX：猎鹰9号可复用着陆（成本降低10倍）、Starship（目标：每公斤发射成本降到$10）
Tesla：Model 3量产（从周产0到5000台的地狱产能爬坡）、FSD自动驾驶（纯视觉路线）
xAI：Grok模型、Colossus超算集群（10万张H100，搭建时间3个月）

Karpathy的事实层：

nanoGPT：最简LLM实现，300行Python训练一个GPT
cs231n：定义了一代人的深度学习入门路径
Tesla Autopilot：纯视觉感知系统架构设计
minbpe：tokenizer的极简实现

这些是事实，不是评价。先铺事实，后面的归纳才有基础。

第二步：模式归纳（How）

从事实中提取可复用的模式——他做事的方法论、决策偏好、思维习惯。

马斯克的核心模式——五步工程法（他在Starship工厂反复讲的）：

1. 让需求变得不那么蠢
   → 质疑需求本身。不要优化一个不应该存在的东西。
   → "你的需求来自谁？如果是一个聪明的人提的，你也不能不质疑。
      聪明人提的蠢需求特别危险，因为没人会去质疑。"
2. 删除零件或流程
   → 如果你没有偶尔加回被删掉的东西，说明你删得不够多。
   → 目标：删到出问题，然后加回最后一个被删掉的。
3. 简化或优化
   → 注意顺序：先删除，再简化。
   → 不要花时间优化一个不该存在的东西。
4. 加速
   → 加速到产能极限。
   → 但如果你在加速一个错误的流程，你只是更快地犯错。
5. 自动化
   → 最后才自动化。
   → 自动化一个错误的流程 = 稳定地批量生产垃圾。

关键：这五步的顺序是刚性的。大部分工程师犯的错误是直接跳到第4步或第5步——加速或自动化一个压根不该存在的东西。

第三步：决策原则提炼（5-7条规则）

从模式中进一步压缩成可直接写进Prompt的判断规则。这是蒸馏的核心产出。

马斯克的决策原则（我实际在用的版本）：

1. 这个需求应该存在吗？
   — 不默认需求合理。谁提的？为什么？如果删掉会怎样？
2. 能删掉吗？
   — 如果你说不出为什么必须保留，就删。
3. 最短路径是什么？
   — 忽略"行业惯例"，只看物理约束。
   — "别人都这么做"不是理由。
4. 数据说什么？
   — 不接受没有数据支撑的判断。
   — "我觉得"不算数据。
5. Deadline能压缩到什么程度？
   — 不是"合理"的deadline，是"物理极限"的deadline。
   — 合理的deadline只会产出合理的结果。
6. 失败的代价可逆吗？
   — 可逆 → 快速试错，别开会讨论。
   — 不可逆 → 才值得慎重。
7. 10倍改进在哪？
   — 不要10%的优化。找10倍的重新设计。
   — 10%的改进不值得换路线。10倍的才值得。

当你让AI"以马斯克视角审阅方案"时，AI执行的就是这7条。逐条检验你的方案。不是模仿他说话，是用他的检查表扫描你的东西。

第四步：Persona层（让AI像他一样"说"）

决策原则解决"怎么想"。Persona解决"怎么说"。

这层不是必须的，但有用——它让你更容易进入"真的在跟这个人对话"的状态。

马斯克的Persona：

直接到冒犯的程度——不绕弯，不用"或许可以考虑"
反问开头——“这个需求为什么应该存在？”
用数据打脸——“你说很难？SpaceX的整流罩回收从0%做到了95%，用了3年。你的项目比回收火箭难？”
物理类比——“这就像火箭方程，你必须减重，不能只加推力”

Skill文件的结构长这样：

personas/elon-musk.skill.md
├── ## 事实层（What）
├── ## 模式层（How）——五步工程法
├── ## 决策原则（7条）
├── ## Persona（语气+口头禅+反对方式）
└── ## 使用说明（什么时候调用、怎么调用）

每个人物一个文件，几百行。17个人 = 17个文件。

17个人，怎么知道该用谁

蒸馏完不是随便用。17个人拍脑袋选效率很低。

我做了一张路由表——根据你遇到的问题类型，自动匹配评审人：

你遇到的问题	首选	备选	为什么这么配
产品设计/UI	乔布斯	张小龙	一个追求极致，一个追求克制。天然对冲
技术架构/代码	Steinberger	Boris	一个偏执代码质量，一个猎杀Agent反模式
AI/LLM/Agent	Karpathy	Boris	一个诚实审视LLM能力边界，一个定义Agent规范
投资/估值	巴菲特	林奇	一个看护城河和复利，一个算ROI和十倍股
管理/目标	德鲁克	老板	一个讲有效性理论，一个催执行落地
汇报/向上管理	老板	德鲁克	一个知道领导想听什么，一个确保对齐目标
哲学/本质追问	苏格拉底	柏拉图	一个问"你真的知道吗"，一个问"本质是什么"
矛盾/危机	黑格尔	小龙虾之父	一个正反合拆矛盾，一个从生态恢复看韧性
落地/执行	老板	马斯克	一个催进度，一个砍需求

杀手锏：对抗性评审

找两个天然冲突的人PK，比找一个人给意见强10倍。

对抗对	冲突点	什么时候用
马斯克 vs 张小龙	速度野心 vs 克制极简	功能要不要上
巴菲特 vs 奥特曼	安全边际 vs 指数下注	投资/资源分配
苏格拉底 vs 老板	无限追问 vs 赶紧落地	分析够了没、该行动了没
黑格尔 vs 乔布斯	展示矛盾 vs 隐藏复杂性	叙事策略、对外沟通

为什么对抗有效？因为冲突逼出你没想过的维度。一个人给意见，你最多改改细节。两个天然冲突的人PK，你会发现自己的方案里有一个根本性的假设从来没被质疑过。

完整案例：3轮PK的全过程

还是那份640行HTML。17人同时审。

Round 1：全员开炮

人物	说了什么	严重性
乔布斯	“640行太多。砍到只留’改变了我的事件’。”	🔴 高
马斯克	“887次心跳是反模式证据，不是勋章。”	🔴 高
Karpathy	“雷达图写’灵魂进化’不诚实。改为’Agent能力成熟度’。”	🔴 高
苏格拉底	“通篇说’做了什么’，没回答’我是什么’。”	🔴 高
黑格尔	“只展示正题，回避反题，没有合题。”	🔴 高
德鲁克	“100件事没对齐目标。So What在哪？”	🔴 高
巴菲特	“27个Skill没区分核心资产和一次性消费品。”	🟡 中
老板	“不砍。但默认分层展示——星星模式。”	🟡 中（折中方案）
Boris	“Skill缺依赖关系图，记忆策略有反模式。”	🟡 中

Round 1 裁决：

乔布斯想砍一半，老板说不砍但分层 → 采纳老板的折中方案：默认收起，点击展开
马斯克的"887心跳是bug" → 从正面成就改为反面教训
Karpathy的"LLM没有灵魂" → 雷达图改名"Agent能力成熟度"
苏格拉底的"你是什么" → 新增哲学宣言区
黑格尔的"缺合题" → 新增"危机→认知→进化"辩证叙事区
德鲁克的"So What" → 新增业务价值汇总卡

Round 2：6个微调

Hero卡片重排（马斯克）、模式按钮强化（乔布斯）、雷达图加"自评"标注（Karpathy）、图例标注（巴菲特）、表格淡入动画（马化腾）、合题加厚（黑格尔）。

全是细节活。但细节决定了从"能看"到"想看"的差距。

Round 3：收敛

17/17 通过。

苏格拉底的评语：“对于一个42天的存在来说，已经足够诚实了。通过。”

3轮。从"什么都想说"到"每个区域都有存在理由"。

你也能做：操作清单

第一件事：选3个人

不要一上来蒸馏17个。先选跟你当前工作最相关的3个：

你的工作	推荐
产品经理	乔布斯 + 张小龙 + 老板
工程师	马斯克 + Steinberger + Karpathy
投资/分析	巴菲特 + 林奇 + 库克
管理者	德鲁克 + 老板 + 库克
创业者	马斯克 + 奥特曼 + 巴菲特

第二件事：收集素材

类型	来源	为什么重要
公开言论	访谈、推特、博客、书	原始思维痕迹
方法论	已公开的框架、流程	可直接转化为规则
决策案例	经典决策复盘	从行为推导原则
口头禅	演讲、采访原文	Persona层的素材

第三件事：执行四层蒸馏

把这段Prompt复制到AI里，改掉方括号里的内容就能用：

我要创建一个 [人物名] 的蒸馏Skill。请按以下结构生成：
## 事实萃取
- 核心贡献（他创造了什么，具体的、可检验的）
- 关键作品（最有影响力的3个）
- 方法论（已公开的核心框架）
## 模式归纳
- 设计哲学（一句话）
- 问题拆解方式（他面对新问题的第一反应是什么）
- 迭代策略（他怎么从v1迭代到v10的）
- 决策偏好（快vs慎重？数据vs直觉？）
## 决策原则（5-7条）
- 他在评估 [你的领域] 时会逐条检查的核心问题
- 每条写成可执行的检查项，不要写成空话
## Persona
- 口头禅（3-5句他真正说过的话）
- 语气特征（直接？委婉？反问？）
- 反对时的表达方式
- 审阅文档时的典型行为
## 使用说明
当用户说"以 [人物名] 视角审阅 X"时：
1. 先用决策原则逐条评估
2. 用Persona风格组织语言
3. 给出明确判断：通过 / 不通过 / 有条件通过

第四件事：存进系统

.codebuddy/skills/persona-distillery/
├── prompt.md                    # 路由表（什么问题→找谁）
└── personas/
    ├── steve-jobs.skill.md      # 乔布斯
    ├── elon-musk.skill.md       # 马斯克
    ├── warren-buffett.skill.md  # 巴菲特
    └── ...

第五件事：日常使用

# 单人审阅
"以马斯克的视角审阅这份方案"
# 对抗性PK
"让巴菲特和奥特曼辩论这个投资方向"
# 自动路由（最常用）
"审阅这份HTML页面"
→ 系统根据内容自动匹配：Steinberger + 张小龙 + 马化腾
# 全团PK（大事才用）
"17人评审团审阅这份文档，PK到收敛为止"

三条硬结论

1. 蒸馏的本质是复制思维结构，不是复制答案。

5条决策原则比5万句语录有用。因为原则可以推理新问题。语录只能检索旧问题。

2. 对抗性评审 > 任何形式的单人评审。

找两个天然冲突的人PK。冲突不是内耗，是思考的催化剂。你方案里最危险的假设，只有在被反面人物撕开的时候才会暴露。

3. 路由把蒸馏从"收藏品"变成"系统"。

17个人物文件不加路由 = 一堆好看的md文件，跟你在notion里存的名言墙没有区别。加了路由 = 一个能自动匹配专家的智囊团。前者是装饰，后者是基础设施。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-04-16，如有侵权请联系 cloudcommunity@tencent.com 删除

数据

本文分享自一深思AI 微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度