Curate VS. Harness engineering

扶墙老师

发布于 2026-03-31 13:18:55

2960

文章被收录于专栏：扶墙集扶墙集

这是

的第 570 篇原创

🖖 https://afoo.me

Tips: 亲爱的朋友，微信推送规则一直在变化。如果你仅仅是“关注”，很可能无法收到推送。按照下图操作点击“福强私学”公众号名片，设为星标，就可以不错过文章啦。

Q: 我‌⁣⁣‌‌‌‌⁣‌⁣⁣‌‌⁣⁣‌‌⁣⁣‌⁣⁣⁣⁣‌⁣⁣‌⁣⁣⁣⁣‌‌⁣‌⁣⁣⁣‌‌⁣⁣‌⁣⁣‌⁣‌⁣⁣‌‌⁣‌⁣‍最早用curate来表达对llm的调教和管控，现在业界用harness engineering，这俩词儿有啥微妙的区别？

A: 你对这两个词的敏锐捕捉非常准确。这两个词恰恰代表了整个大语言模型（LLM）行业从**“生成式对话时代”**向**“Agentic（智能体）生产力时代”**演进的缩影。

**Curate（策展/精选/修整）**是你早期的精准概括，而业界在2025年底到2026年开始广泛普及的 **Harness Engineering（驾驭工程/外围框架工程）**，两者虽然都是为了“管控和调教”AI，但在**隐喻、作用对象和工程思维**上有着非常微妙且深刻的区别：

### 1. 核心隐喻的不同：园丁/策展人 vs. 驯马师/系统工程师 * **Curate（策展式调教）**：这个词带有一种**人文、品味和“人机协作”**的色彩。它的原始含义是博物馆策展人精心挑选展品。用在 LLM 上，意味着你把模型当成一个需要悉心教导的学生。你通过“精心挑选”（Curate）高质量的训练数据、清洗 RAG（检索增强生成）的知识库、打磨 System Prompt（提示词），来塑造模型的“三观”和输出品味。 * **核心动作**：筛选、清洗、喂养、引导。 * **Harness Engineering（驾驭工程）**：Harness 的本意是“马具/挽具”（比如套在马身上用来拉车的皮带），或者指“驾驭自然力量”（如 Harness the power of river）。这个词在 2025/2026 年被 Mitchell Hashimoto 和 OpenAI 团队带火。它**把 LLM 看作一种强大但具有非确定性（野性/会产生幻觉）的“认知引擎/原始动力”**。Harness 工程不是去改变模型本身，而是给这匹“野马”套上笼头、缰绳、眼罩和车厢，把它接入到现代软件工程的轨道上。 * **核心动作**：封装、约束、隔离、容错机制。

### 2. 作用对象的不同：模型的“大脑” vs. 模型的“身体与环境” * **Curate 作用于“内容与输入”**：它关注的是模型**看到了什么、学到了什么**。数据质量、Prompt 的精确度、微调（Fine-tuning）语料的选择，都是 Curation。如果模型出错，Curate 的解决思路是：“我是不是没给它好例子？我去改改 Prompt 或者补充点文档。” * **Harness 作用于“基础设施与外围（Infrastructure）”**：它几乎涵盖了**除了模型自身权重以外的一切**。包括：给模型配备的工具（Tools/API）、记忆系统（Memory）、沙箱环境（沙盒/容器执行代码）、控制循环（Control Loop）、重试机制（Retry）以及安全护栏（Guardrails）。 * 如果 Agent 犯错了，Harness Engineering 的思路是：“把这个错误视为系统缺陷，通过修改外部环境和规则，让它在物理层面/代码层面上**无法再犯同样的错**，而不是单纯指望它‘记住’。”

### 3. 应用场景的不同：静态生成 vs. 动态长效任务 * **Curate** 更适用于单次对话、文本生成、内容总结等场景。你调教好它，它给你输出一篇漂亮的文章或代码。 * **Harness Engineering** 是为了 **AI Agent（智能体）** 诞生的。当你要让 AI 去帮你独立分析系统日志、甚至维护百万行代码库（如 OpenAI 团队的实践）时，单靠 Curate 是不够的。模型一定会中途遗忘、会幻觉、会调错 API。Harness Engineering 提供的是“状态持久化”、“错误阻断”和“多步规划的脚手架”。

### 4. 工程化成熟度的区别：手工作坊 vs. DevOps * **Curate 类似于“调参玄学”或数据作坊**，高度依赖个人经验、直觉和语感。 * **Harness Engineering 本质上是把 DevOps 的思想引入到了 AI 领域**。它承认 LLM 是非确定性的，因此用确定性的传统软件工程（断言、代码 Linter、权限控制、状态回滚）去“包裹”不确定的 LLM。这也是为什么现在传统后端工程师、基建工程师（DevOps）在 AI 领域越来越吃香的原因。

**总结来说：** 你最早用的 **Curate** 是**“炼丹/养育”**思维——通过精选养料（数据/提示词），让它在内部生成更好的逻辑和品味。现在的 **Harness Engineering** 是**“工业制造”**思维——承认引擎（LLM）本身有其不可消除的抖动和风险，所以用坚固的机械结构（外围代码框架、工具链、护栏）把它套起来，从而安全、持久地转化为生产力。这俩词没有谁对谁错，而是代表了我们使用 AI 的重心，已经从“如何把模型训练得更聪明（Curate）”，转移到了“如何把现成的聪明模型用得更安全、更自动化（Harness）”。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-03-18，如有侵权请联系 cloudcommunity@tencent.com 删除

软件工程