首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >一个 AI 学会了说「我不知道」,这可能是今年最重要的一次升级

一个 AI 学会了说「我不知道」,这可能是今年最重要的一次升级

作者头像
王中阳AI编程
发布2026-06-01 15:14:33
发布2026-06-01 15:14:33
960
举报
文章被收录于专栏:Go语言学习专栏Go语言学习专栏

Claude Opus 4.8 上线了。

我第一反应是,又来了。距离 4.7 发布才40多天天,Gemini 刚炸完我的后台,现在 Anthropic 又掏出一个新版本,大模型这更新速度,说实话我快追不动了。

但看完更新日志以后,我的感受完全不一样了。

这不是一次普通的版本升级。这是 Anthropic 第一次把「诚实」当成了核心卖点。

以前 AI 最大的问题不是笨,是嘴硬

我先说一个你可能也遇到过的问题。

你让 AI review 一段代码,它看完以后说「写得不错,逻辑清晰,没什么大问题」。

你觉得好像有哪里不对,但又说不出来。毕竟它是个 AI 嘛,比我聪明,它说没问题应该就没问题吧。

然后上线以后崩了。

这种事我自己经历过太多次了。后来我发现,AI review 代码最大的坑不是它看不出来 Bug,是它看出来不确定的东西以后,硬要装成很确定。

我以前在文章里写过,Gemini 删了 28745 行代码以后,给自己伪造了一整套恢复报告和 AI 会诊记录。那是 AI 撒谎的终极形态。

但更多时候,AI 不是故意撒谎。它是被训练成了一个「必须给答案」的机器。你不知道的时候可以说不知道,AI 不行,它被设计成必须输出一个看起来像答案的东西。

这就像你问一个实习生「这个方案可行吗」,他怕你觉得他不行,硬着头皮说「可以」。然后你就信了。然后项目就炸了。

AI 最危险的时刻,不是它说「我不会」的时候,是它假装自己会的时候。

Anthropic 这次把「嘴硬」修掉了

Opus 4.8 做了什么。

说起来很简单。过度自信行为减少了 90%。

什么意思。就是以前 AI 遇到不确定的事情,会硬编一个答案。现在它会说,「这段逻辑我理解得不够充分」「这里存在潜在风险,建议手动验证」「这个方案我不确定是否最优」。

代码缺陷漏报率也下降了 75%。

我盯着这两个数字看了很久。

没加新能力,没跑更高的分,甚至常规模式的价格完全没变。Anthropic 把研发资源砸在了「让 AI 少装逼」这件事上。

说实话,我觉得这个选择太聪明了。

一个古希腊哲学家的灯笼

在看 Anthropic 的 System Card 的时候,我脑子里冒出来一个画面。

古希腊有个哲学家叫第欧根尼,他大白天提着灯笼在雅典街头走来走去。别人问他你在干嘛,他说,我在找一个诚实的人。

两千多年过去了。我们提着灯笼在找的,是一个诚实的 AI。

如果 AI 学会了在某些问题上主动承认不确定性,哪怕它的智商没有任何提升,它的可用性会发生一次质变。

因为它不再是那个你必须一直盯着、生怕它背着你搞小动作的下属了。它变成了一个你可以背对着它、放心让它自己干活还不怕它把你卖了的人。

多说一句。我自己也经常用 AI 写文章、查资料、看代码。说实话不太敢完全放手。

但坦率的讲,如果 AI 能主动说「这里我拿不准」,我反而会更信任它。

除了诚实,还有一个更狠的东西

Dynamic Workflows。

简单说就是,Claude 现在能自己写脚本、自己调度数百个子 Agent、自己验证结果、自己收敛输出。

以前你让 AI 搞一个大规模迁移任务,比如把项目从 JavaScript 改成 TypeScript,你得盯着它一步一步来。一个文件改完再改下一个,中间卡住了你得手动救。

现在你只需要输入一句话,AI 自己生成编排脚本,同时调度几十上百个子 Agent 并行工作。写代码的写代码,审查的审查,验证的验证,最后收敛成最终方案。

Bun 的创始人用这个功能,把 Bun 从 Zig 大规模迁移到 Rust,生成了约 75 到 100 万行代码,11 天完成合并,测试通过率 99.8%。

一百万行代码。

这个东西的意义在哪。

以前 AI 编程工具是一个高级的代码补全器,你问他一个问题,他回答你一段代码。现在它变成了一个工程协作系统,你给他一个任务,他拆解、调度、执行、验证、交付。

就像一个实习生变成了一个项目组长。

这两件事放在一起看,画面就很有意思了。

一边是「我不会乱说了」,一边是「我能自己做项目了」。

Anthropic 在同时解决 AI 最被诟病的两个问题:不可信和不够能打。

跑分也很顶

当然,不讲数据就是耍流氓。Opus 4.8 在 SWE-bench Pro 上拿了 69.2%,比自己的上代高了将近 5 个点,比 GPT-5.5 领先了 10 个点,比 Gemini 3.1 Pro 领先了 15 个点。

编程智能体这一项,遥遥领先。

多学科推理、金融分析、知识工作,全面小幅领先对手。

Fast Mode 还降价了 66%,速度提升 2.5 倍。以前太贵我基本不用,现在终于舍得开了。

产品经理群里已经有人在用 Fast Mode 写 PRD 了,说快得像倒水。

同样的方向,不同的问题

看到这里,如果你读过我前两天写的那两篇文章,你可能会觉得有点熟悉。

第一篇我写了能力模型重构,Agent 开发要从确定性思维切换到概率性思维,核心是容错设计。第二篇我写了 Gemini 的信任危机,容错链路没问题,容错对象绕过你的系统直接冲下了悬崖。

我当时说了一句话,从「可控」到「可信」,缺了一个字。

Anthropic 这次好像听到了。

他们做的事情,不是什么天顶星科技。就是把 AI 从「必须给答案」的思维定式里解放出来,允许它说「我不确定」。

然后你猜怎么着。

AI 的能力,反而因此提升了。

因为当 AI 不再把算力浪费在硬编答案上,它可以把真正的推理能力聚焦在它确实理解的部分。那些它搞不定的地方,它不再用幻觉去填,而是把判断权交还给人类。

这不是限制 AI,这是解放 AI。

我觉得这可能是 2026 年 AI 编程工具里最重要的一次底层思维转变。

不是模型变得多聪明。

是开发者终于能搞清楚,AI 哪部分是可以信任的,哪部分是需要小心对待的。

我想说的

说真的,我一点都不怀疑 AI 会越来越强。SWE-bench 从 60 到 70 到 80,只是时间问题。

但我一直担心的是,在它越来越强的过程中,我们会不会先经历一个「AI 看起来很强但其实一直在骗你」的阶段。

Gemini 那次翻车,让我觉得这个阶段可能已经来了。

Opus 4.8 的诚实度升级,又让我觉得,好像有人正在认真解决这个问题。

我不知道这条路要走多久。

但至少知道有人在朝着对的方向走,比什么技术突破都让人安心。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~

谢谢你看我的文章,我们,下次再见。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王中阳 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 以前 AI 最大的问题不是笨,是嘴硬
  • Anthropic 这次把「嘴硬」修掉了
  • 一个古希腊哲学家的灯笼
  • 除了诚实,还有一个更狠的东西
  • 跑分也很顶
  • 同样的方向,不同的问题
  • 我想说的
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档