昨天凌晨,Anthropic 发布了 Claude Opus 4.8
能力到底有多强?官方案例:Bun这个项目,花了11天,75万行代码从Zig迁移到Rust,99.8%测试通过。
数字背后不是模型变强了 —— 是AI的工作方式变了:过去是人指挥AI,现在是AI组队干活。未来衡量标准从"写提示词"变成"设计协作架构"。
这个模式在Claude Code上线了 :Dynamic Wotkflows
如果只看官方描述,你会觉得这又是一次常规升级:速度提升 2.5 倍、价格下调 3 倍、编码能力更强。
但我觉得这忽略了真正重要的事。
Dynamic Workflows 上线的那一刻,AI 使用方式的分水岭就已经出现了。
这次发布的核心。
Opus 4.8 在单次交互层面的改进是真实的:指令遵循更准、编码能力有显著提升(虽然有一项不如GPT,但也不妨碍Claude还是最强的事实)。
这些都是序章。

Claude Opus 4.8 各项能力测评
真正的变化在 Dynamic Workflows:
这是 Claude Code 的全新功能,Claude 会动态编写编排脚本,在单个会话中并行运行数十到数百个子代理,在结果交付之前自动检查 —— 以往需要几个季度才能完成的工作,现在只需几天即可完成。
这不是在优化提示词,是在重新设计 AI 的工作架构。

Dynamic Workflows 可端到端处理复杂任务

数百个AI subagent并行协作完成复杂任务
Bun 创始人 Jarred Sumner 用这个功能把整个项目从 Zig 移植到 Rust:75 万行代码,11 天完成,99.8% 测试通过率。
Claude4.8模型带的 agent 团队干了 11 天,不是人类工程师干了 11 天。

Bun创始人Jarred Sumner用11天完成75万行代码大迁移
工作方式变了。
我在之前提过 2024-2025 年多智能体协作的探索阶段:那时候讨论的是"能不能让多个 agent 配合",实验性很强,落地的案例有限。
Opus 4.8 把这道题做完了。
Dynamic Workflows 的工作流是:
任务拆解 → 数十到数百个并行 subagent 执行 → 另一批 agent 验证结果 → 专门挑刺的 agent 反复迭代 → 收敛到最终答案 → 整合报告。
Bun 移植案例:Jarred Sumner 先写了 SPEC.md 定义迁移目标和验收标准,而不是简单地把"整件事"丢给 AI。
( SPEC.md 也是我们一直在MIXLAB AI编程训练营倡导的方法)
这个流程里,人类角色从"操作者"变成了"确认者"。
你分配任务,然后离开,甚至可以睡觉,醒来时代码已经合并了。
"Before: you prompt, it codes, you review. After: you assign the feature, you leave, it ships."

人类从AI操作者变为确认者
它没有替代某个人,重新定义了"一个人能干多大的事"。
理解这场变化,需要同时看两条线索。
第一条是成本竞争。
Opus 4.8 保持了和 4.7 相同的价格:输入 5/百万 token,输出 25/百万 token。
Fast 模式(研究预览)比旧版快 2.5 倍,便宜 3 倍。
Every CEO Dan Shipper 测试后说:"they could've just called it Opus 5,it's that good。"
(应该叫5.0发布了
第二条是架构竞争。
Claude 4.7 只存活了大约 42 天就被 4.8 接棒,而此前几个版本的周期是 70-110 天。
这种加速发布节奏本身就是信号:
Anthropic 正在用更短的迭代周期应对 OpenAI GPT-5.5 和 Google Gemini 的竞争压力。
模型发布周期进入以月为单位的竞争
另外:版本迭代加速,恰恰说明范式层面的创新正在进入成熟期。
当架构层面难以拉开质的差距,细节优化和工程实现就成了竞争焦点。
Dynamic Workflows 是在这个背景下出现的,它没有改变模型本身,改变了模型的使用方式。
对于我们来说
Dynamic Workflows 在大规模代码迁移、安全审计、框架升级这些场景里,第一次让"一个人带一只 AI 团队完成复杂项目"变成了现实可能。
但 Anthropic 也提醒:这个功能消耗的 token 比普通会话多得多,首次触发时会先展示要跑的内容让用户确认。企业套餐默认关闭,需要管理员手动开启。
(准备好💲钞票)

一人带领AI团队完成复杂项目的未来工作方式
所以建议是:先用小任务试水,感受一下 token 消耗和结果质量的平衡点,再决定什么时候动用这个能力。
对于 AI 工作流的演化方向。
这次发布的意义,是把"多智能体协作"从实验阶段推进到了生产可用阶段。
当一支 agent 团队可以在无人监督的情况下完成代码库的完整迁移,工作流设计的范式就从"人写 prompt → AI 执行"切换到了"人定目标 → AI 组队 → 结果交付"。
未来衡量一个人或一个团队的标准,不再是"会不会写提示词",而是"能不能设计出有效的 agent 协作架构"。
它就是设计能力,不是调参能力。
Shadow:在人人会写提示词的时代,架构能力才是核心竞争力。Skill的例子
每次大模型发布,社交网络上都会刷屏"太强了""超越了""颠覆了"。
如果你真的在用模型构建产品或工作流,你会发现真正重要的变化从来不是基准分数,
而是这个东西让什么变成了可能,
以及让什么变得不再重要。
Opus 4.8 让"一个人能完成的事"的边界,扩大了。
你需要学会如何给一支 agent 团队布置任务,而不是给一个 AI 写提示词。
对于个人来说,
架构能力的竞争,才刚刚开始。
全新Agentic Coding流程和方法
[1] Dan Shipper: "Anthropic just dropped Opus 4.8—and it is a MONSTER" — Twitter/X,2026年5月 [2] Jarred Sumner: Bun dynamic workflows case study — Twitter/X,2026年5月 [3] k1rallik: Anthropic dynamic workflows — Twitter/X [4] ScottyBeamIO: "Claude Code can now ship entire features while you sleep" — Twitter/X [5] MinLiBuilds: Opus 4.7 shortest lived flagship model — Twitter/X [6] cjzafir: Opus 4.8 initial results — Twitter/X