首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Curate VS. Harness engineering

Curate VS. Harness engineering

作者头像
扶墙老师
发布2026-03-31 13:18:55
发布2026-03-31 13:18:55
1510
举报
文章被收录于专栏:扶墙集扶墙集

这是

的第 570 篇原创

🖖 https://afoo.me

Tips: 亲爱的朋友,微信推送规则一直在变化。如果你仅仅是“关注”,很可能无法收到推送。按照下图操作点击“福强私学”公众号名片,设为星标,就可以不错过文章啦。

Q: 我‌⁣⁣‌‌‌‌⁣‌⁣⁣‌‌⁣⁣‌‌⁣⁣‌⁣⁣⁣⁣‌⁣⁣‌⁣⁣⁣⁣‌‌⁣‌⁣⁣⁣‌‌⁣⁣‌⁣⁣‌⁣‌⁣⁣‌‌⁣‌⁣‍最早用curate来表达对llm的调教和管控,现在业界用harness engineering, 这俩词儿有啥微妙的区别?

A: 你对这两个词的敏锐捕捉非常准确。这两个词恰恰代表了整个大语言模型(LLM)行业从**“生成式对话时代”**向**“Agentic(智能体)生产力时代”**演进的缩影。

**Curate(策展/精选/修整)**是你早期的精准概括,而业界在2025年底到2026年开始广泛普及的 **Harness Engineering(驾驭工程/外围框架工程)**,两者虽然都是为了“管控和调教”AI,但在**隐喻、作用对象和工程思维**上有着非常微妙且深刻的区别:

### 1. 核心隐喻的不同:园丁/策展人 vs. 驯马师/系统工程师 * **Curate(策展式调教)**:这个词带有一种**人文、品味和“人机协作”**的色彩。它的原始含义是博物馆策展人精心挑选展品。用在 LLM 上,意味着你把模型当成一个需要悉心教导的学生。你通过“精心挑选”(Curate)高质量的训练数据、清洗 RAG(检索增强生成)的知识库、打磨 System Prompt(提示词),来塑造模型的“三观”和输出品味。 * **核心动作**:筛选、清洗、喂养、引导。 * **Harness Engineering(驾驭工程)**:Harness 的本意是“马具/挽具”(比如套在马身上用来拉车的皮带),或者指“驾驭自然力量”(如 Harness the power of river)。这个词在 2025/2026 年被 Mitchell Hashimoto 和 OpenAI 团队带火。它**把 LLM 看作一种强大但具有非确定性(野性/会产生幻觉)的“认知引擎/原始动力”**。Harness 工程不是去改变模型本身,而是给这匹“野马”套上笼头、缰绳、眼罩和车厢,把它接入到现代软件工程的轨道上。 * **核心动作**:封装、约束、隔离、容错机制。

### 2. 作用对象的不同:模型的“大脑” vs. 模型的“身体与环境” * **Curate 作用于“内容与输入”**:它关注的是模型**看到了什么、学到了什么**。数据质量、Prompt 的精确度、微调(Fine-tuning)语料的选择,都是 Curation。如果模型出错,Curate 的解决思路是:“我是不是没给它好例子?我去改改 Prompt 或者补充点文档。” * **Harness 作用于“基础设施与外围(Infrastructure)”**:它几乎涵盖了**除了模型自身权重以外的一切**。包括:给模型配备的工具(Tools/API)、记忆系统(Memory)、沙箱环境(沙盒/容器执行代码)、控制循环(Control Loop)、重试机制(Retry)以及安全护栏(Guardrails)。 * 如果 Agent 犯错了,Harness Engineering 的思路是:“把这个错误视为系统缺陷,通过修改外部环境和规则,让它在物理层面/代码层面上**无法再犯同样的错**,而不是单纯指望它‘记住’。”

### 3. 应用场景的不同:静态生成 vs. 动态长效任务 * **Curate** 更适用于单次对话、文本生成、内容总结等场景。你调教好它,它给你输出一篇漂亮的文章或代码。 * **Harness Engineering** 是为了 **AI Agent(智能体)** 诞生的。当你要让 AI 去帮你独立分析系统日志、甚至维护百万行代码库(如 OpenAI 团队的实践)时,单靠 Curate 是不够的。模型一定会中途遗忘、会幻觉、会调错 API。Harness Engineering 提供的是“状态持久化”、“错误阻断”和“多步规划的脚手架”。

### 4. 工程化成熟度的区别:手工作坊 vs. DevOps * **Curate 类似于“调参玄学”或数据作坊**,高度依赖个人经验、直觉和语感。 * **Harness Engineering 本质上是把 DevOps 的思想引入到了 AI 领域**。它承认 LLM 是非确定性的,因此用确定性的传统软件工程(断言、代码 Linter、权限控制、状态回滚)去“包裹”不确定的 LLM。这也是为什么现在传统后端工程师、基建工程师(DevOps)在 AI 领域越来越吃香的原因。

**总结来说:** 你最早用的 **Curate** 是**“炼丹/养育”**思维——通过精选养料(数据/提示词),让它在内部生成更好的逻辑和品味。 现在的 **Harness Engineering** 是**“工业制造”**思维——承认引擎(LLM)本身有其不可消除的抖动和风险,所以用坚固的机械结构(外围代码框架、工具链、护栏)把它套起来,从而安全、持久地转化为生产力。 这俩词没有谁对谁错,而是代表了我们使用 AI 的重心,已经从“如何把模型训练得更聪明(Curate)”,转移到了“如何把现成的聪明模型用得更安全、更自动化(Harness)”。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 福强 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档