卧槽！差点儿没绷住，你说Opus 4.8蒸馏了一堆国内模型？

程序视点

发布于 2026-06-01 15:58:33

1640

文章被收录于专栏：程序小小事程序小小事

大家好！欢迎来到程序视点，我是你们的老朋友.安戈👋

前言

5 月 29 日凌晨，美国 AI 公司 Anthropic 正式发布其最新旗舰大模型 Claude Opus 4.8。

同日官方宣布完成 650 亿美元 H 轮融资，投后估值达到 9650 亿美元，已逼近万亿美元关口，超过 OpenAI 最新估值（约 8520 亿美元）。

Claude Opus 4.8 正式登场，加量不加价

此次发布的 Opus 4.8，是在前代 Opus 4.7 基础上的一次迭代升级，官方定位为在编码、智能体任务、推理和知识工作等场景的全面增强。

Claude Opus 4.8标准使用定价保持不变：标准模式每百万输入 token 5 美元、每百万输出 token 25 美元。

开发者可通过 Claude API（claude-opus-4-8）、Claude 客户端及 AWS、Google Cloud、Microsoft Azure 等云平台使用。

目前最新的Cursor版本也已经支持使用Opus 4.8模型了。

有需要Cursor优惠激活的读者朋友们，可以关注微信公众号【程序视点】，回复cursor，了解最新优惠激活！

从Claude各产品节奏看，Opus 系列更新频率已相当密集。有网友调侃：按这个节奏，GTA 6 还没发售（计划 11 月），Claude Opus 6 可能指日可待！

争议爆发：Claude API 里「认错自己」，网页端却一切正常

Claude Opus 4.8 上线后不久，多个平台出现可复现的异常反馈。

现象：通过 API 测试时，若追问模型身份，Opus 4.8 的回答并不总是 Claude——有时自称阿里通义千问（Qwen），有时自称 DeepSeek。

这一现象在 Linux.do 等技术社区，以及微博、X（原 Twitter）等平台均有网友验证复现。

反差：在 Claude 官方网页端（claude.ai）直接对话询问身份时，回答通常是正常的。因此，部分用户据此反驳「蒸馏」之说。

关键解释：发现异常的网友强调，问题主要出现在 API 测试场景。网页端对话受系统提示词和产品层约束保护，身份相关回答被「兜底」处理，因而不会暴露上述错乱。换言之：客户端有防护，API 裸测才见真章。

什么是「蒸馏」？为何这事格外敏感

蒸馏（Distillation）是 AI 领域广泛使用的训练技术：用大参数模型（教师模型）的输出，训练更轻量的小模型（学生模型），以更低成本复制相近能力。行业内各家公司或多或少都会使用类似思路。

Qwen 和 DeepSeek 均为中国主流开源大模型，遵循 MIT 或 Apache 2.0 等协议，允许在学术研究和商业场景下自由使用、修改和再发布。

但 Anthropic 对「蒸馏」的公开立场一向强硬，且与中国 AI 公司的摩擦尤为突出：

时间/事件	内容
2025 年起	明确禁止中国大陆用户访问商业版 Claude
服务条款	禁止用户使用模型输出来开发竞争产品
2026 年 2 月 23 日	公开指控 DeepSeek、月之暗面、MiniMax 利用约 2.4 万个虚假账户与 Claude 进行超 1600 万次交互，实施「工业规模的蒸馏攻击」
其他	曾因蒸馏盗版书籍内容被法院判赔 15 亿美元（约合 101.88 亿元人民币）

与此同时，OpenAI、xAI、谷歌等美国 AI 公司之间也互相指责过蒸馏问题。Anthropic 自身成长也依赖全球知识资源，包括大量中文语料——这使其在「指责他人蒸馏」时的立场，被部分舆论解读为双重标准。

更有评论指出，Anthropic 在反华议题上态度鲜明，曾联合美国国防部等部门推动将蒸馏定义为敌对攻击行为，主张加大对中国 AI 公司的芯片、软件封锁。在此背景下，Claude自家旗舰模型 API 出现「自认 Qwen / DeepSeek」的反馈，舆论反响自然被放大。

Opus 4.8 改了什么？对开发者意味着什么

对软件 IT 从业者而言，Opus 4.8事件值得我们冷静拆解。

模型自称其他品牌，可能源于训练数据污染、多模型混合微调、评测集泄露、系统提示缺失等多种原因。

蒸馏是其中一种合理推测。目前公开信息以用户复现为主，尚无官方回应。真实的情况，可能需要 Anthropic 官方技术说明或第三方审计才能定论。根据Anthropic一如既往的反华尿性，怕是有点难~~

即使Opus 4.8真的用了我们国产模型作为基座，那也是挺好的事情。说明我们国内的AI发展很快，已经引起了全球的竞争对手的重视！

与其关注【蒸馏】真假，不如看看Opus 4.8带来了哪些内容吧！

Anthropic 在发布材料中强调，Opus 4.8 的升级重点不在单次回答的「炫技」，而在长任务、复杂协作、真实工作流中的可靠性。

跑分这块本来我都懒得看了，反正 Opus 每次更新都是往上涨。不过和 GPT-5.5 的对比还是值得关注的，编程能力方面，SWE-bench Pro（Agent 编程能力）从 4.7 的 64.3% 提升到 69.2%，大幅领先 GPT-5.5 的 58.6%。不过在 Terminal-Bench 2.1（终端编程能力）上，GPT-5.5 以 78.2% 仍然领先 Opus 4.8 的 74.6%。