日 · Java + Harness Engineering + 渐进式披露 + SPI1. 1.2 当前版本:基于 Harness Engineering 的重构直到 Harness Engineering 方法论的引入,A2UI 才真正找到了自己的"灵魂"。 2.3 阶段三:Harness 式驾驭(Harness-Driven)Harness Engineering 代表了 AICode 的第三个阶段。 Harness Engineering:从"祈祷式编程"到"驾驭式工程"3.1 什么是 Harness Engineering? Harness Engineering 的灵魂在于:它让概率性系统变得可工程化。
Q: 我最早用curate来表达对llm的调教和管控,现在业界用harness engineering * **Harness Engineering(驾驭工程)**:Harness 的本意是“马具/挽具”(比如套在马身上用来拉车的皮带),或者指“驾驭自然力量”(如 Harness the power * **Harness Engineering** 是为了 **AI Agent(智能体)** 诞生的。 Harness Engineering 提供的是“状态持久化”、“错误阻断”和“多步规划的脚手架”。 ### 4. 工程化成熟度的区别:手工作坊 vs. * **Harness Engineering 本质上是把 DevOps 的思想引入到了 AI 领域**。
Harness Engineering 从 Prompt Engineering 到 Context Engineering,再到 Harness Engineering,AI 工程的重心,正在从 “怎么把话说对 这也是 Harness Engineering 开始被频繁提起的背景。 二、Harness Engineering 到底是什么 通俗来说,Harness Engineering 就是围绕 AI Agent 搭建一整套 “可执行、可验证、可约束、可迭代” 的外层运行系统。 三、Harness Engineering 与其他 Engineering 的核心区别 为了更好理解,我把三者放在一起对比: • Prompt Engineering(2022-2024 主流)主要优化单次交互的质量 四、Harness Engineering 的核心原理与落地实践 Harness Engineering 的底层逻辑并不复杂,它的关键不在于继续优化提示词,也不在于单纯扩展上下文,而是在模型之外搭建一套能够支撑
Harness Engineering 的核心理念是:AI 参与问题分析、方案设计、编码实现、审查和验证,但最终判断权始终留在工程师手中。 Harness Engineering 正是在这个框架里把 AI 当作协作者,而不是让 AI 成为"绕过约束的捷径"。 03 什么是 Harness Engineering? 要理解为什么我们的框架叫 Harness Engineering,先看看 "Harness" 这个词在 AI 工程语境中的含义变化。 Engineering 的四大标准组件 业界对 Harness Engineering 的共识拆解为四大子系统: ┌────────────────────────────────────────── Harness Engineering 不是从抽象方法论开始的,而是从音乐商业化团队每天面对的研发复杂度里长出来的。
01 从 Prompt 到 Context 再到 Harness:AI 编程的三次跃迁 1.1 什么是 Harness Engineering? 2026 年 2 月,OpenAI 工程师 Ryan Lopopolo 发了一篇很有分量的文章——Harness engineering: leveraging Codex in an agent-first OpenAI 管这种工作方式叫 Harness Engineering。Harness 这个词本意是"马具、挽具"——马再好,不套上鞍具它也拉不了车。 给 AI Agent 套上合适的 Harness,它才能稳定地干活。 这就是 Harness。 03 搭建 Harness:具体做了什么 3.1 多 Agent 协作体系 为什么不能只用一个 Agent?
团队发布了一项震撼性的实验报告「Harnessengineering:leveragingCodexinanagent-firstworld」(https://openai.com/zh-Hans-CN/index/harness-engineering 发布官方博客的同一时期,Anthropic也发布了题为「Harnessdesignforlong-runningapplicationdevelopment」(https://www.anthropic.com/engineering HarnessEngineering的核心公式可以表达为「Agent=Model+Harness」,揭示了HarnessEngineering的本质:模型负责原始推理能力,而Harness负责除此之外的一切 Anthropic对Harness的定义更加简洁有力:「模型之外的一切」,所有的代码、配置、执行逻辑、约束规则、反馈回路,只要不是模型本身,都属于Harness的范畴。 这一定义明确了Harness的边界,将所有工程化可控的部分都纳入其中。
「把意图和规范写进仓库」,本身就是 Harness Engineering 的核心工作之一。 05 Harness Engineering 的具体启示 前面四节在回答「SDD 为什么有意义」。 这正是 Harness Engineering 的实质——也正是 SDD 在解决的问题。 构建 SDD 体系,不是在做一件和 Harness Engineering 平行的事,而是在回答 Harness Engineering 最核心的那个追问:究竟需要什么样的 scaffolding,才能让 OpenAI 工程团队 《Harness Engineering》官方博客文章,2026 年 2 月 https://openai.com/index/harness-engineering/ 关于本文的说明
AI 落地真相:那些 Prompt 之外的事 Harness Engineering 全解 一个尴尬的事实 很多人以为 AI 落地就是"写好 Prompt"。 这就是 Harness Engineering——AI 应用的"驾驭工程"。今天把它的全貌讲清楚。 一、Prompt Engineering:已经不够用了 先说 Prompt Engineering,因为它是被谈论最多的,也是被误解最多的。 ↓ 工具调用 / 记忆管理 / 评测监控 Harness Engineering 不是某一项技术,它是一套工程化能力。 这,才是 Harness Engineering 追求的东西。
最近AI圈又流行起来一个新词:Harness Engineering,给AI套上缰绳的约束系统。
上一篇文章《Multi-Agent系统Harness Engineering架构的思考与实践》我们从 agent 与 MAS 的技术脉络、单 agent 到多 agent 的工程化边界、协调拓扑选择,结合 multi-agent项目实践整理,提出了一套针对multi-agent项目场景的harness engineering四层治理架构。 那Agent Harness与传统软件架构、平台工程到底是什么关系呢?如果不把这个关系说清楚,“agent harness engineering” 很容易被理解成一种把旧问题重新包装的新概念。 Agent Harness Engineering 的六个承重点 基于这个项目里的几轮收敛经验,以及前面提到的公开实践,暂且把这一类承重工程工作收束为 agent harness engineering , 2026. https://www.anthropic.com/engineering/harness-design-long-running-apps [30] OpenAI, Harness engineering
[27]Anthropic,Harnessdesignforlong-runningapplicationdevelopment,2026.https://www.anthropic.com/engineering .https://openai.com/index/harness-engineering/[31]Anthropic,ClaudeCodeautomode:asaferwaytoskippermissions ,2026.https://www.anthropic.com/engineering/claude-code-auto-mode[36]ClaudeCodeDocs,Automateworkflowswithhooks ,2025.https://learn.microsoft.com/en-us/platform-engineering/what-is-platform-engineering[16]MicrosoftLearn ,Self-servicewithguardrailstoempowerdevelopers,2025.https://learn.microsoft.com/th-th/platform-engineering
Harness架构设计之前,我们还有必要先厘清MAS核心的设计选择-协调拓扑。 考虑到MAS复杂度高于单agent,在MAS中生效的Harness工程架构应用范围可以覆盖单agent,所以后文提到的harness的架构设计都以MAS为基准进行设计知识供给层:不是仓库,是主动的信息生态定位 复盘后定位到的根因是:Harness工程上缺少多层次治理的解耦设计。 这正是三阶段演化能够成立的前提-不是因为模型越来越强就可以去掉Harness,而是因为Harness在,模型才可以将其决策推理应用到容错性更低,但价值更高的场景结语当下大模型和agent技术都发展飞快, building-effective-agentsAnthropic—BuildingAgentswiththeClaudeAgentSDK(2025)·https://www.anthropic.com/engineering
一、起源:从 Prompt 到 Harness 的三次跃迁 想要理解 Harness Engineering 为什么出现,得先看我们是怎么一步步走到这里的。 于是就有了Harness Engineering这个名字。 搭信息环境的人 Harness Engineering 整个环境该怎么运作? 二、原理:为什么瓶颈在环境 2.1 核心公式 Harness Engineering 的底层公式很简单: Agent = Model + Harness 其中,模型负责推理,Harness 负责模型之外的一切 四、怎么开始:Harness Engineering 三阶段路线图详解 4.1 Harness Engineering 三阶段路线图 Harness Engineering 不是"一把梭",推荐渐进式推进
OpenAI 最近发了一篇工程文章,题目是 Harness engineering: leveraging Codex in an agent-first world。
而接下来要讲的,才是最关键的一步: 这些零件为什么拼在一起以后,会变成一整套 Harness Engineering。 1.8 什么是 Harness Engineering,以及它在我们工程里的全貌 如果前面那些概念你都看完了,这里其实就可以把它们串起来了。 如果非要打个比方,我会说: Harness Engineering 就像是在给 AI 搭一整套“工程作战系统”。 当你真的进入多角色、多阶段、长期迭代的工程开发以后,模型分层配置本身就会变成 Harness Engineering 里非常重要的一部分。 因为 Harness Engineering 从来不是“一次设计到位”,而是跑一段、撞墙、补洞、再跑一段、再升级。
今天继续跟着我和Claude学习Harness Engineering驾驭者工程。这个我在前面就谈到了是AI编程工程化的一个重点,核心是让AI软件工程更加安全,可控,可靠的运行。 关于本文:本文基于对 Claude Code 六大核心维度的深度研究,从 Harness Engineering(驾驭工程)哲学视角重新审视 Claude Code 的设计逻辑。 Claude Code 被真正广泛采用的背后,是一套经过深思熟虑的设计哲学——Harness Engineering(驾驭工程)。 Harness Engineering Harness Engineering 的核心思想并非新鲜事物,但在 AI 工具时代获得了新的生命力。 Claude 这是 Harness Engineering 最具代表性的体现:复杂系统在无人值守时,依然在被结构化地驾驭运转,而非自由生长或停摆。
02 Harness Engineering Harness Engineering这个词缘起于 2026 年 2 月 11 日 OpenAI 发布了一篇文章:《Harness engineering: 文章还介绍他们实践Harness Engineering过程中踩的一些坑,我读后收益匪浅,这里概括的介绍一下。 04 Harness Engineering 和控制论 4.1 业界观点 George在 X 上发布的长文《Harness Engineering Is Cybernetics》,文中提到这种模式他见到三次 05 对我的影响 前面对控制论做了简介,讲了OpenAI的提出的Harness Engineering以及一篇比较火的对Harness Engineering分析的帖子,总结了我的一些思考,这些内容对我的影响是巨大的 /harness-engineering/) 《Harness Engineering Is Cybernetics》(https://x.com/odysseus0z/status/2030416758138634583
这不是魔法,这是一个正在被正式命名的工程实践:Harness Engineering。 一个月之内,Harness Engineering 从一篇博客文章变成了开发者社区的高频词。 Harness 到底在做什么 根据 OpenAI 官方报告的描述,Harness 由三个核心类别组成: 第一层:Context Engineering(上下文工程)。 Harness Engineering 代表的思维转变是:从「优化输入内容」到「优化系统环境」。 Prompt Engineering 关注的是「说什么」,Context Engineering 关注的是「给什么上下文」,而 Harness Engineering 关注的是「在什么条件下运行」。
(2025)→ Harness Engineering(2025+) 配了一句话让我想了挺久:「名词换了五六轮,核心问题从未改变——在不确定性上构建确定性。」 Harness Engineering 讲的是:不要靠提示词说服 AI 表现好,要靠工程框架约束 AI 的行为边界。 Harness Engineering 的核心洞察在这里就能用上:凡是你希望 AI「一定」做到的事,就不要靠提示词,要靠结构。 五、高风险操作前,停下来确认 Harness Engineering 里的「危险操作拦截」:涉及外部写入、数据删除、发送消息的操作,不能靠提示词约束,要在代码层做硬拦截。 七、最后 Harness Engineering 的核心洞察是:大多数 Agent 出问题,不是模型的问题,是脚手架的问题。
(2025)→ Harness Engineering(2025+)。 这也是为什么 Harness Engineering 这个词会出现——专门描述"围绕模型的那层工程壳"。 今天从 Harness Engineering 的视角重新看一遍,你会发现 OpenClaw 其实是一个教科书级的 Harness 实现。 这是 Harness Engineering 的第二条原则:让模型的初始状态可重现,而不是随机的。 这是 Harness 设计的第三条原则:给模型最小化、最精确的能力集。 四、Android 上的 Harness Engineering 说完原理,说实践。