首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >卧槽!差点儿没绷住,你说Opus 4.8蒸馏了一堆国内模型?

卧槽!差点儿没绷住,你说Opus 4.8蒸馏了一堆国内模型?

作者头像
程序视点
发布2026-06-01 15:58:33
发布2026-06-01 15:58:33
1640
举报
文章被收录于专栏:程序小小事程序小小事

大家好!欢迎来到程序视点,我是你们的老朋友.安戈👋

前言

5 月 29 日凌晨,美国 AI 公司 Anthropic 正式发布其最新旗舰大模型 Claude Opus 4.8

同日官方宣布完成 650 亿美元 H 轮融资,投后估值达到 9650 亿美元,已逼近万亿美元关口,超过 OpenAI 最新估值(约 8520 亿美元)。

Claude Opus 4.8 正式登场,加量不加价

此次发布的 Opus 4.8,是在前代 Opus 4.7 基础上的一次迭代升级,官方定位为在编码、智能体任务、推理和知识工作等场景的全面增强。

Claude Opus 4.8标准使用定价保持不变:标准模式每百万输入 token 5 美元、每百万输出 token 25 美元。

开发者可通过 Claude API(claude-opus-4-8)、Claude 客户端及 AWS、Google Cloud、Microsoft Azure 等云平台使用。

目前最新的Cursor版本也已经支持使用Opus 4.8模型了。

有需要Cursor优惠激活的读者朋友们,可以关注微信公众号【程序视点】,回复cursor,了解最新优惠激活!

从Claude各产品节奏看,Opus 系列更新频率已相当密集。有网友调侃:按这个节奏,GTA 6 还没发售(计划 11 月),Claude Opus 6 可能指日可待!

争议爆发:Claude API 里「认错自己」,网页端却一切正常

Claude Opus 4.8 上线后不久,多个平台出现可复现的异常反馈。

现象: 通过 API 测试时,若追问模型身份,Opus 4.8 的回答并不总是 Claude——有时自称阿里通义千问(Qwen),有时自称 DeepSeek

这一现象在 Linux.do 等技术社区,以及微博、X(原 Twitter)等平台均有网友验证复现。

反差: 在 Claude 官方网页端(claude.ai)直接对话询问身份时,回答通常是正常的。因此,部分用户据此反驳「蒸馏」之说。

关键解释: 发现异常的网友强调,问题主要出现在 API 测试场景。网页端对话受系统提示词和产品层约束保护,身份相关回答被「兜底」处理,因而不会暴露上述错乱。换言之:客户端有防护,API 裸测才见真章

什么是「蒸馏」?为何这事格外敏感

蒸馏(Distillation) 是 AI 领域广泛使用的训练技术:用大参数模型(教师模型)的输出,训练更轻量的小模型(学生模型),以更低成本复制相近能力。行业内各家公司或多或少都会使用类似思路。

Qwen 和 DeepSeek 均为中国主流开源大模型,遵循 MIT 或 Apache 2.0 等协议,允许在学术研究和商业场景下自由使用、修改和再发布。

但 Anthropic 对「蒸馏」的公开立场一向强硬,且与中国 AI 公司的摩擦尤为突出:

时间/事件

内容

2025 年起

明确禁止中国大陆用户访问商业版 Claude

服务条款

禁止用户使用模型输出来开发竞争产品

2026 年 2 月 23 日

公开指控 DeepSeek、月之暗面、MiniMax 利用约 2.4 万个虚假账户与 Claude 进行超 1600 万次交互,实施「工业规模的蒸馏攻击」

其他

曾因蒸馏盗版书籍内容被法院判赔 15 亿美元(约合 101.88 亿元人民币)

与此同时,OpenAI、xAI、谷歌等美国 AI 公司之间也互相指责过蒸馏问题。Anthropic 自身成长也依赖全球知识资源,包括大量中文语料——这使其在「指责他人蒸馏」时的立场,被部分舆论解读为双重标准

更有评论指出,Anthropic 在反华议题上态度鲜明,曾联合美国国防部等部门推动将蒸馏定义为敌对攻击行为,主张加大对中国 AI 公司的芯片、软件封锁。在此背景下,Claude自家旗舰模型 API 出现「自认 Qwen / DeepSeek」的反馈,舆论反响自然被放大。

Opus 4.8 改了什么?对开发者意味着什么

对软件 IT 从业者而言,Opus 4.8事件值得我们冷静拆解。

模型自称其他品牌,可能源于训练数据污染、多模型混合微调、评测集泄露、系统提示缺失等多种原因。

蒸馏是其中一种合理推测。目前公开信息以用户复现为主,尚无官方回应。真实的情况,可能需要 Anthropic 官方技术说明或第三方审计才能定论。根据Anthropic一如既往的反华尿性,怕是有点难~~

即使Opus 4.8真的用了我们国产模型作为基座,那也是挺好的事情。说明我们国内的AI发展很快,已经引起了全球的竞争对手的重视!

与其关注【蒸馏】真假,不如看看Opus 4.8带来了哪些内容吧!

Anthropic 在发布材料中强调,Opus 4.8 的升级重点不在单次回答的「炫技」,而在长任务、复杂协作、真实工作流中的可靠性

跑分这块本来我都懒得看了,反正 Opus 每次更新都是往上涨。不过和 GPT-5.5 的对比还是值得关注的,编程能力方面,SWE-bench Pro(Agent 编程能力)从 4.7 的 64.3% 提升到 69.2%,大幅领先 GPT-5.5 的 58.6%。不过在 Terminal-Bench 2.1(终端编程能力)上,GPT-5.5 以 78.2% 仍然领先 Opus 4.8 的 74.6%。

这次更新我觉得最值得关注的有 3 点:

1)动态工作流:Claude Code 里可以一次性派出几百个并行子 Agent,最多 16 个同时跑、单次上限 1000 个 Agent。适合大规模代码迁移这种硬骨头活儿。

不过大多数用户应该用不上这个功能,就好比你开了个公司,也没必要一次性雇几百个人,日常开发哪来这么大的需求。

2)代码自查能力暴涨:官方说 Opus 4.8 漏检代码缺陷的概率比 4.7 降低了 4 倍。也就是说 AI 写完代码之后,自己就能发现更多 Bug,一把梭跑通的成功率更高了

3)Fast Mode 大降价:Fast 模式可以让同样的模型处理速度翻倍,而且比之前的 Fast Mode 便宜 3 倍。

看数据是一方面,AI 编程模型好不好用,还是得拿真实项目来检验。

目前Cursor已经支持使用Opus 4.8最新模型了。有需要的读者朋友,可以关注微信公众号【程序视点】,回复cursor,了解最新优惠活动!

最后

Claude Opus 4.8 的发布,本可以是一场关于「编码更稳、智能体更强、思考可调」的产品叙事。

就目前的蒸馏、双标、中美 AI 博弈情况,个人建议倒是:与其站队吵赢,不如先弄清Opus 4.8对日常开发仍有实际价值。

争议不应掩盖技术本身的可验证性,实践才是真标准。能把事情干好,就先不论白猫还是黑猫了。

我们提供Cursor独享账号,支持最新Opus 4.8模型,直发账号+密码,非试用,非续杯,非号池,非插件,非工具。

无需任何多余操作,官网后台可查用量和模型,安全稳定,编程必备!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序视点 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • Claude Opus 4.8 正式登场,加量不加价
  • 争议爆发:Claude API 里「认错自己」,网页端却一切正常
  • 什么是「蒸馏」?为何这事格外敏感
  • Opus 4.8 改了什么?对开发者意味着什么
  • 最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档