
这两天,《置身钉内》刷屏。

我看完之后,第一反应不是想评价钉钉 ONE 做得对不对。那篇文章太长,里面的人、组织、理想和压力都很复杂,站在外面轻飘飘地下判断,其实没什么意思。
我只是想起自己以前做过的一个项目。规模当然没法跟钉钉 ONE 比,但它给我的那一下冲击,我到现在都记得。
当时我们在做一个运维相关的东西,里面有个想法是做 AI 故障定位。
线上出了问题,AI 可以根据历史经验判断可能是什么原因,应该先查哪里,下一步怎么处理。
01 我当时真的觉得这事能成
我当时觉得这个想法挺自然的。
运维团队做了这么多年,系统里肯定有很多历史工单、SOP、故障复盘、处理经验。把这些东西整理一下,做成知识库,再让 AI 去查,不就能用了么?
尤其是 SOP 和经验复盘这种东西,名字太有迷惑性了。标准作业流程,经验总结,故障复盘。你很难不觉得它们就是知识。
后来我拿着这个想法去找一个资深运维聊。他听完之后,没有顺着我的思路往下聊,只说了一句,别搞这个,没用。
我当时其实不太服。
这里面也有一点我的私心。我总觉得,公司里自己写下来的经验,肯定比外面通用资料更适合公司。
它知道我们的系统、链路,也知道那些只有内部人才懂的坑。
如果 AI 能把这些东西重新用起来,就等于把公司过去很多年的沉淀重新翻出来。所以他说没用的时候,我不是完全听不进去,我是有点不甘心。
我又追着问他,有没有哪些字段能用,哪些工单质量会高一点,哪些复盘值得优先整理。
他跟我说,这些经验你最好别信。很多都是系统流程最后一步随手填的。故障处理完了,系统要求填一下经验总结,填完这单就结束了。没人审核,没人复用,很多时候也没人真的看。
他说到这里,我还是有点转不过来。几千条记录都在系统里摆着,再差也不至于完全没用吧。
筛一筛、洗一洗,总能捞出一点东西。
02 后来我花了 3 天去验证
后来我还是不信邪,真的花了 3 天去筛。
5000 多条历史经验,光是一眼看上去明显乱填的,就筛掉了 4000 多条。剩下的我又让 AI 判断根因,再结合实际场景看,又筛掉了一批。
最后留下一些看起来还算像样的内容,放进知识库里试。
结果发现,还不如不用。
因为很多故障本来就不可复现,场景稍微一变,原来的经验就不成立。AI 拿着这些经验去推荐排查方向,反而会把人带偏。
这比「没用」还麻烦。没用的东西,顶多是不帮忙。会误导人的东西,是在添乱。
我拿这个结果去找那个资深运维。他说,你看,我早说了吧。
这些东西没人看,大家都是随便填的。谁敢写真正原因?都在甩锅。
假的原因,还不如没有来得真实。
这句话我记了很久。
因为没有知识库,你至少知道自己不知道。但一个假的知识库,会让你误以为自己知道。
后来他还跟我说,他以前在公司也组织过类似的项目。一开始愿景也很美好。大家都希望能沉淀经验,形成知识库,让后来的人少踩坑。
但做着做着,事情就会变形。
有些人不愿意写得太细,有些人不愿意把真实原因放出来,有些东西写出来就会牵扯责任。最后留下来的内容,看起来很完整,实际用的时候又很虚。
03 最后问题不在知识库
我当时才慢慢理解,真正打碎我的不是数据筛掉了多少。
而是我原来以为自己在清洗知识,其实我是在清洗一个组织的自我保护机制。
很多经验总结不是为了让后来的人少踩坑写的。它只是流程的最后一个格子。你填完,它就结束了。填得好,通常没有什么奖励。填得太真实,反而可能惹麻烦。
尤其在一个惩罚机制比奖励机制更突出的组织里,人会很自然地学会写安全的话。它不一定是假话,但它也不是真正的经验。它更像一种不会出事的表达。
这件事后来让我对「知识库」三个字谨慎了很多。
以前我看到 SOP、复盘、历史工单,会下意识觉得这是资产。现在我会先停一下,想想这些东西是在什么环境里写出来的。
所以后来我没有继续逼大家多填几条经验,而是改了一个方向,做了一个「经验卡」功能。经验不再只是工单结束时藏在系统里的一个字段,而是可以被其他人看到。
写得好,别人会用,会收藏,会引用。这个功能不复杂,也谈不上多高级,但它至少改了一点点写经验的动机。以前填经验是为了把流程走完,现在写经验是在同行面前留下一个能被看见的判断。
当然,它解决不了所有问题。只要涉及责任归因,大家还是会谨慎。
但我从那次之后真的记住了一件事:
AI 项目不是把模型接进去就完了。你得先看懂这个组织里的人为什么这样做事。
所以我看钉钉 ONE 的争议时,会有一种很熟悉的感觉。
钉钉当然不是没有数据。它有组织关系,有消息,有日程,有审批,有已读未读,还有各种协作链路。这些东西对 AI 来说,看起来都是很好的上下文。
但这些上下文不是干净的。它们里面有上下级,有管理习惯,有催办,有缓冲,有人不想被看见的部分,也有人特别想看见别人的部分。
AI 一进去,很多原来靠人情、默契和模糊空间维持的东西,就会被重新翻出来。
它可能让一些事情更高效,也可能让一些人更透明。它可能帮一部分人省时间,也可能把另一部分人的压力放大。
所以我现在看 AI 项目,会比以前慢一点。我不会一上来就问,这个功能能不能做。我会先问,这些材料是谁写的,为什么这么写,写错有没有代价,写真话有没有风险。
如果这些没看清楚,模型越强,反而越容易把原来的问题放大。
真实项目里,很多时候更重要的是,你能不能看懂那个组织里的人为什么这样说话,为什么这样填表,为什么这样复盘,为什么有些东西明明在系统里,却不能直接相信。
这些东西听起来不 AI。
但它们决定了 AI 最后能不能落地。