前两天我搞到两本电子书。
一本叫《Claude Code 设计指南》,一本叫《Claude Code 与 Codex 的 Harness 设计哲学》。
说实话,光看书名我就已经开始犯困了……
我跳着翻了几页,全是 query.ts、exec_policy、rollout 这种源码级的东西。我一个产品经理,看到这些词的感觉,大概跟普通人看到一份全英文医疗器械说明书差不多,脑子直接进入待机状态。
但我还是硬着头皮往下翻了。
不是因为爱读技术文档。是因为这两本书翻来覆去在讲同一件事,而且这件事,跟每个用AI的人都有关。
它们到底讲了什么,我待会再聊。
先跟你说说我第一次是怎么翻车的。
01先说一个反面教材
我打开 Notebook LM,把两本PDF直接丢了进去。
点生成播客。
等了几十秒,出来了。
我戴上耳机,跟我翻PDF一样,选择跳着听了一下。
。。。
怎么说呢,不是不能听。
是那种「两个AI在念课本」的感觉。什么Thread ID、什么Rollout、什么StateDB Bridge,我自己跳着听了不到三分钟就关掉了。
emmmm,这可是我自己丢进去的素材,结果我自己都听不下去。
我转成文字稿给你们体会下:

这还真不是工具不行。Notebook LM 配 Gemini 3.5 Flash,本身就是个好东西。是我没告诉它,这个东西最终给谁听,应该从什么角度讲。
我直接把素材丢进去,然后坐在那等奇迹。
这就是典型的「没上规矩」。
02回到那两本书
它们反复在讲一句话。
AI 模型不可靠,所以聪明的使用者会主动给它上规矩,而不是把它当万能助手放任自流。
这套方法论,技术圈管它叫 Harness。说实话这个词去年下半年就开始有人提了,Anthropic、OpenAI、Cursor 这些公司陆续在讲 agent harness,到今年这个概念算是正式出圈了。
当时 Hermes 也刚火起来,圈内有个比喻我印象特别深,把 Hermes 比作马,Harness 就是缰绳。
马再强,没有缰绳它就是野马。
我那个废物播客,就是没上缰绳的结果。
03我是怎么「上缰绳」的
关掉那个播客之后,我没有马上重做。
先停了一下,想了想到底差在哪。
然后换了条路。我没有再把书直接丢给 Notebook LM,而是先把两本书喂给了 Claude Opus,直接跟它说,我想做一个个性化的双人语音播客,但不知道应该重点讨论什么内容。我可以把这两份PDF发给你,然后你来帮我决定。
Claude 给了我一版。

坦率的讲,第一版太深了。
它设计的播客主题是「当我们承认大语言模型不可靠时,秩序到底应该坐在系统的哪一层」。我看完就跟它直说了,你这个太深入了,对于日常在职场里用AI提效的人来说,这些架构层的东西完全不相关。有没有更接地气的建议。

然后 Claude 重新调整了方向
不聊 Harness 架构了。改成提炼这两本书里能带走的反常识洞见,把底层原理翻译成「我每天用AI能避开哪些坑、能提高哪些效率」。
期间省略几轮我跟它来回扯皮的过程,最终claude给出来的新的提示词如下:

你还真别说,这回完全不一样了。
我把这套调整后的提示词重新喂给 Notebook LM。生成的播客、PPT、思维导图、闪卡,跟第一次直接丢进去的产物比。
一个天一个地。
我这里把新的思维导图贴出来,大家可以感受下,很贴近普通人用法了。

说到底,同样的素材,同样的工具。唯一的区别是,我有没有先想清楚规矩。
04规矩不是一句提示词
写到这我停下来想了三秒。
因为我突然意识到,我跟 Claude 那一轮来回,它本身就是 Harness。
我没有让AI自由发挥。我先想清楚了我要什么、给谁听、从什么角度,然后把这些规矩告诉AI,让它在这个框里干活。它跑偏了,我拉回来。
我是真的觉得,这个顺序看着简单,拆开看其实有四件事。我按我自己的理解翻译成人话。
第一件事,让AI能连续干活。
不是一问一答就完事了。是设计一个循环,让它一步步往前推。
我跟 Claude 的对话不是一轮就停的,出方案,我反馈,它调整,再出方案,来回好几轮。每一轮的结果都喂给下一轮,这才叫连续工作。
你回想一下你用AI翻车的经历。是不是经常这样,它出了一版你觉得还行但不够好,然后你就将就着用了?第一件事就没做。
第二件事,让AI跑偏了能被纠正。
我发现第一版太深了,马上拉回来。
如果我不拉,它就会沿着「技术哲学」一路狂奔,最后产出一个只有程序员能听懂的播客。你用AI写方案、做PPT也是一样,第一版出来不对劲,你得有意识把它拽回正轨,而不是凑合。
第三件事,让多个工具串成工作流。
我不是只用了一个工具。Claude 负责想策略和生成提示词,Notebook LM 负责生成最终内容。两个工具各司其职,串起来才是完整工作流。
很多人的问题是每个工具单独用,从来没想过怎么让它们打配合。
第四件事,让协作有人管。
谁负责想,谁负责做,谁负责检查。这不是AI自己能安排的,是你设计出来的。
在我这个案例里,Claude 是策略官,Notebook LM 是执行者。而我是产品经理,定方向、做质检、拍板。
说真的,你把自己用AI翻车的经历往回倒一下,是不是都能归到这四件事的某一环上。
直接丢个文档让AI总结,没告诉它给谁看、重点是什么。第一件事没做。
AI写了一版你觉得不对劲,但你没反馈,直接用了。第二件事没做。
每个工具单独用,从来没想过串起来。第三件事没做。
所有事情指望一个AI一次性搞定,没有分工。第四件事没做。
05下次动手前,先想30秒
不是列清单。就是脑子里过一下。
这个东西最终给谁用。你希望它从什么角度切入。它如果跑偏了,你怎么拉回来。
想清楚这三件事再动手。你会发现AI的产出质量有一个肉眼可见的跳跃。
不是AI变聪明了。
是你给它上了规矩。
06写在最后
那两本技术书里有一段话,我看到的时候真的停了好几秒。
我们总觉得AI越自由越好,给它越多空间它越能发挥。
但这两本书的结论刚好反过来。越是强大的工具,越需要明确的边界。
马的能力再强,没有缰绳它就是野马。你不是不信任它,你是知道它会跑偏,所以才主动给它上缰绳。
先想规矩,再让AI干活。这个顺序,比你用什么模型、装什么插件都重要。
试试看。