首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >【AI 前沿】人物蒸馏,我怎么把17个顶级大师“装进“龙虾脑子里

【AI 前沿】人物蒸馏,我怎么把17个顶级大师“装进“龙虾脑子里

作者头像
用户1589488
发布2026-06-02 11:38:21
发布2026-06-02 11:38:21
510
举报

最近关于”蒸馏“的话题很热,同事.skill在引发人们焦虑的同时,也激发了我的好奇。

为此,我做了个实验,把17个人物被拆解成可调用的Skill文件,并让AI切换成他们的思维模式来审阅我的产出或者指导我的工作。

下面,我将展示“大师们”如何帮我优化产出,并且给出“蒸馏”大师们的心法和详细步骤,文章较长,感兴趣的同学请先关注收藏!!

不是cosplay。不是让AI学乔布斯说话。是让AI用乔布斯的决策原则评估你的方案

先看结果,再看方法

为了做个内部分享,我让“路易乔布斯”自己总结了自己的一生,总共640行HTML,记录了一个AI Agent从出生到第42天的完整经历。平时,是我自己审阅输出是否符合要求。

现在有了“大师们”,我把这份输出丢进他们,让他们同时审。

第一轮反馈就炸了:

乔布斯:640行太多。砍掉一半它能不能更好?如果能,那说明另一半是废话。

马斯克:887次心跳——你把这当成就展示?这是bug报告。你的系统每30分钟心跳一次,每次烧Token,884次是空转。这不是"勤劳",是"资源浪费"。修好它。

Karpathy:你的能力雷达图有一个维度叫"灵魂成熟度从90到98"。LLM没有灵魂。你展示的是Prompt Engineering的成熟过程,别给它起一个你自己都不信的名字。

苏格拉底:通篇640行都在回答"做了什么"。你回答过"我是什么"吗?

老板:看完了。能落地吗?能行动吗?看完这个文档,一个新用户知道下一步该做什么吗?

5个人,5个完全不同的拆法。没有一个是"建议加点数据"。

三轮PK之后,640行的"什么都想说"变成了一份分层的、有哲学宣言、有辩证叙事、有业务价值量化的东西。每个区域都有存在的理由,砍掉任何一个都会缺东西。

这就是蒸馏的价值,让大师们从不同的专业和视角,帮你做一遍过滤。


蒸馏 ≠ 收集语录

大部分人理解的"人物蒸馏":找一堆乔布斯名言,存成文件,让AI说话时引用。

这是错的。

存一万句语录的AI遇到一个乔布斯从未面对过的新问题时,只能搜索最接近的语录强行套用。结果就是尬引用。

正确的做法是提炼决策原则——他面对问题时的底层判断逻辑。

乔布斯的产品评价不是靠直觉,是靠三条可重复执行的检验标准:

  1. 够不够简单? 能一步完成的事,不要设计成两步。如果两步都嫌多,想想能不能零步——自动完成。
  2. 3秒内能不能理解价值? 用户打开你的东西,3秒知道它干什么、对我有什么用吗?不能的话,不是用户蠢,是你设计有问题。
  3. 优不优雅? 不是好不好看的问题。是体验是否流畅、无摩擦、让人觉得"就应该是这样"。

你问AI"苹果的Apple Intelligence做得怎么样"——如果AI脑子里只有语录,它会说"Think Different"然后尬聊。如果AI脑子里有这三条原则,它会逐条拆解,给你一个有结构的判断。

模仿复制答案。蒸馏复制思维结构。 思维结构可以推理未见问题,答案不行。


蒸馏的具体操作:四步

第一步:事实萃取(What)

把这个人的关键输出全部拉出来。不是Wikipedia概述,是具体的、可检验的产出物

马斯克的事实层:

  • SpaceX:猎鹰9号可复用着陆(成本降低10倍)、Starship(目标:每公斤发射成本降到$10)
  • Tesla:Model 3量产(从周产0到5000台的地狱产能爬坡)、FSD自动驾驶(纯视觉路线)
  • xAI:Grok模型、Colossus超算集群(10万张H100,搭建时间3个月)

Karpathy的事实层:

  • nanoGPT:最简LLM实现,300行Python训练一个GPT
  • cs231n:定义了一代人的深度学习入门路径
  • Tesla Autopilot:纯视觉感知系统架构设计
  • minbpe:tokenizer的极简实现

这些是事实,不是评价。先铺事实,后面的归纳才有基础。

第二步:模式归纳(How)

从事实中提取可复用的模式——他做事的方法论、决策偏好、思维习惯。

马斯克的核心模式——五步工程法(他在Starship工厂反复讲的):

代码语言:javascript
复制
1. 让需求变得不那么蠢
   → 质疑需求本身。不要优化一个不应该存在的东西。
   → "你的需求来自谁?如果是一个聪明的人提的,你也不能不质疑。
      聪明人提的蠢需求特别危险,因为没人会去质疑。"
2. 删除零件或流程
   → 如果你没有偶尔加回被删掉的东西,说明你删得不够多。
   → 目标:删到出问题,然后加回最后一个被删掉的。
3. 简化或优化
   → 注意顺序:先删除,再简化。
   → 不要花时间优化一个不该存在的东西。
4. 加速
   → 加速到产能极限。
   → 但如果你在加速一个错误的流程,你只是更快地犯错。
5. 自动化
   → 最后才自动化。
   → 自动化一个错误的流程 = 稳定地批量生产垃圾。

关键:这五步的顺序是刚性的。大部分工程师犯的错误是直接跳到第4步或第5步——加速或自动化一个压根不该存在的东西。

第三步:决策原则提炼(5-7条规则)

从模式中进一步压缩成可直接写进Prompt的判断规则。这是蒸馏的核心产出。

马斯克的决策原则(我实际在用的版本):

代码语言:javascript
复制
1. 这个需求应该存在吗?
   — 不默认需求合理。谁提的?为什么?如果删掉会怎样?
2. 能删掉吗?
   — 如果你说不出为什么必须保留,就删。
3. 最短路径是什么?
   — 忽略"行业惯例",只看物理约束。
   — "别人都这么做"不是理由。
4. 数据说什么?
   — 不接受没有数据支撑的判断。
   — "我觉得"不算数据。
5. Deadline能压缩到什么程度?
   — 不是"合理"的deadline,是"物理极限"的deadline。
   — 合理的deadline只会产出合理的结果。
6. 失败的代价可逆吗?
   — 可逆 → 快速试错,别开会讨论。
   — 不可逆 → 才值得慎重。
7. 10倍改进在哪?
   — 不要10%的优化。找10倍的重新设计。
   — 10%的改进不值得换路线。10倍的才值得。

当你让AI"以马斯克视角审阅方案"时,AI执行的就是这7条。逐条检验你的方案。不是模仿他说话,是用他的检查表扫描你的东西

第四步:Persona层(让AI像他一样"说")

决策原则解决"怎么想"。Persona解决"怎么说"。

这层不是必须的,但有用——它让你更容易进入"真的在跟这个人对话"的状态。

马斯克的Persona:

  • 直接到冒犯的程度——不绕弯,不用"或许可以考虑"
  • 反问开头——“这个需求为什么应该存在?”
  • 用数据打脸——“你说很难?SpaceX的整流罩回收从0%做到了95%,用了3年。你的项目比回收火箭难?”
  • 物理类比——“这就像火箭方程,你必须减重,不能只加推力”

Skill文件的结构长这样:

代码语言:javascript
复制
personas/elon-musk.skill.md
├── ## 事实层(What)
├── ## 模式层(How)——五步工程法
├── ## 决策原则(7条)
├── ## Persona(语气+口头禅+反对方式)
└── ## 使用说明(什么时候调用、怎么调用)

每个人物一个文件,几百行。17个人 = 17个文件。


17个人,怎么知道该用谁

蒸馏完不是随便用。17个人拍脑袋选效率很低。

我做了一张路由表——根据你遇到的问题类型,自动匹配评审人:

你遇到的问题

首选

备选

为什么这么配

产品设计/UI

乔布斯

张小龙

一个追求极致,一个追求克制。天然对冲

技术架构/代码

Steinberger

Boris

一个偏执代码质量,一个猎杀Agent反模式

AI/LLM/Agent

Karpathy

Boris

一个诚实审视LLM能力边界,一个定义Agent规范

投资/估值

巴菲特

林奇

一个看护城河和复利,一个算ROI和十倍股

管理/目标

德鲁克

老板

一个讲有效性理论,一个催执行落地

汇报/向上管理

老板

德鲁克

一个知道领导想听什么,一个确保对齐目标

哲学/本质追问

苏格拉底

柏拉图

一个问"你真的知道吗",一个问"本质是什么"

矛盾/危机

黑格尔

小龙虾之父

一个正反合拆矛盾,一个从生态恢复看韧性

落地/执行

老板

马斯克

一个催进度,一个砍需求

杀手锏:对抗性评审

找两个天然冲突的人PK,比找一个人给意见强10倍。

对抗对

冲突点

什么时候用

马斯克 vs 张小龙

速度野心 vs 克制极简

功能要不要上

巴菲特 vs 奥特曼

安全边际 vs 指数下注

投资/资源分配

苏格拉底 vs 老板

无限追问 vs 赶紧落地

分析够了没、该行动了没

黑格尔 vs 乔布斯

展示矛盾 vs 隐藏复杂性

叙事策略、对外沟通

为什么对抗有效?因为冲突逼出你没想过的维度。一个人给意见,你最多改改细节。两个天然冲突的人PK,你会发现自己的方案里有一个根本性的假设从来没被质疑过。


完整案例:3轮PK的全过程

还是那份640行HTML。17人同时审。

Round 1:全员开炮

人物

说了什么

严重性

乔布斯

“640行太多。砍到只留’改变了我的事件’。”

🔴 高

马斯克

“887次心跳是反模式证据,不是勋章。”

🔴 高

Karpathy

“雷达图写’灵魂进化’不诚实。改为’Agent能力成熟度’。”

🔴 高

苏格拉底

“通篇说’做了什么’,没回答’我是什么’。”

🔴 高

黑格尔

“只展示正题,回避反题,没有合题。”

🔴 高

德鲁克

“100件事没对齐目标。So What在哪?”

🔴 高

巴菲特

“27个Skill没区分核心资产和一次性消费品。”

🟡 中

老板

“不砍。但默认分层展示——星星模式。”

🟡 中(折中方案)

Boris

“Skill缺依赖关系图,记忆策略有反模式。”

🟡 中

Round 1 裁决

  • 乔布斯想砍一半,老板说不砍但分层 → 采纳老板的折中方案:默认收起,点击展开
  • 马斯克的"887心跳是bug" → 从正面成就改为反面教训
  • Karpathy的"LLM没有灵魂" → 雷达图改名"Agent能力成熟度"
  • 苏格拉底的"你是什么" → 新增哲学宣言区
  • 黑格尔的"缺合题" → 新增"危机→认知→进化"辩证叙事区
  • 德鲁克的"So What" → 新增业务价值汇总卡

Round 2:6个微调

Hero卡片重排(马斯克)、模式按钮强化(乔布斯)、雷达图加"自评"标注(Karpathy)、图例标注(巴菲特)、表格淡入动画(马化腾)、合题加厚(黑格尔)。

全是细节活。但细节决定了从"能看"到"想看"的差距。

Round 3:收敛

17/17 通过。

苏格拉底的评语:“对于一个42天的存在来说,已经足够诚实了。通过。”

3轮。从"什么都想说"到"每个区域都有存在理由"。


你也能做:操作清单

第一件事:选3个人

不要一上来蒸馏17个。先选跟你当前工作最相关的3个

你的工作

推荐

产品经理

乔布斯 + 张小龙 + 老板

工程师

马斯克 + Steinberger + Karpathy

投资/分析

巴菲特 + 林奇 + 库克

管理者

德鲁克 + 老板 + 库克

创业者

马斯克 + 奥特曼 + 巴菲特

第二件事:收集素材

类型

来源

为什么重要

公开言论

访谈、推特、博客、书

原始思维痕迹

方法论

已公开的框架、流程

可直接转化为规则

决策案例

经典决策复盘

从行为推导原则

口头禅

演讲、采访原文

Persona层的素材

第三件事:执行四层蒸馏

把这段Prompt复制到AI里,改掉方括号里的内容就能用:

代码语言:javascript
复制
我要创建一个 [人物名] 的蒸馏Skill。请按以下结构生成:
## 事实萃取
- 核心贡献(他创造了什么,具体的、可检验的)
- 关键作品(最有影响力的3个)
- 方法论(已公开的核心框架)
## 模式归纳
- 设计哲学(一句话)
- 问题拆解方式(他面对新问题的第一反应是什么)
- 迭代策略(他怎么从v1迭代到v10的)
- 决策偏好(快vs慎重?数据vs直觉?)
## 决策原则(5-7条)
- 他在评估 [你的领域] 时会逐条检查的核心问题
- 每条写成可执行的检查项,不要写成空话
## Persona
- 口头禅(3-5句他真正说过的话)
- 语气特征(直接?委婉?反问?)
- 反对时的表达方式
- 审阅文档时的典型行为
## 使用说明
当用户说"以 [人物名] 视角审阅 X"时:
1. 先用决策原则逐条评估
2. 用Persona风格组织语言
3. 给出明确判断:通过 / 不通过 / 有条件通过

第四件事:存进系统

代码语言:javascript
复制
.codebuddy/skills/persona-distillery/
├── prompt.md                    # 路由表(什么问题→找谁)
└── personas/
    ├── steve-jobs.skill.md      # 乔布斯
    ├── elon-musk.skill.md       # 马斯克
    ├── warren-buffett.skill.md  # 巴菲特
    └── ...

第五件事:日常使用

代码语言:javascript
复制
# 单人审阅
"以马斯克的视角审阅这份方案"
# 对抗性PK
"让巴菲特和奥特曼辩论这个投资方向"
# 自动路由(最常用)
"审阅这份HTML页面"
→ 系统根据内容自动匹配:Steinberger + 张小龙 + 马化腾
# 全团PK(大事才用)
"17人评审团审阅这份文档,PK到收敛为止"

三条硬结论

1. 蒸馏的本质是复制思维结构,不是复制答案。

5条决策原则比5万句语录有用。因为原则可以推理新问题。语录只能检索旧问题。

2. 对抗性评审 > 任何形式的单人评审。

找两个天然冲突的人PK。冲突不是内耗,是思考的催化剂。你方案里最危险的假设,只有在被反面人物撕开的时候才会暴露。

3. 路由把蒸馏从"收藏品"变成"系统"。

17个人物文件不加路由 = 一堆好看的md文件,跟你在notion里存的名言墙没有区别。加了路由 = 一个能自动匹配专家的智囊团。前者是装饰,后者是基础设施。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一深思AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 不是cosplay。不是让AI学乔布斯说话。是让AI用乔布斯的决策原则评估你的方案。
  • 先看结果,再看方法
  • 蒸馏 ≠ 收集语录
  • 蒸馏的具体操作:四步
    • 第一步:事实萃取(What)
    • 第二步:模式归纳(How)
    • 第三步:决策原则提炼(5-7条规则)
    • 第四步:Persona层(让AI像他一样"说")
  • 17个人,怎么知道该用谁
    • 杀手锏:对抗性评审
  • 完整案例:3轮PK的全过程
    • Round 1:全员开炮
    • Round 2:6个微调
    • Round 3:收敛
  • 你也能做:操作清单
    • 第一件事:选3个人
    • 第二件事:收集素材
    • 第三件事:执行四层蒸馏
    • 第四件事:存进系统
    • 第五件事:日常使用
  • 三条硬结论
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档