
6 月 1 日,Anthropic 向美国 SEC 提交了保密版 S-1 草案,启动 IPO 流程。
3 天后,Anthropic Institute 又发布了一篇长文,标题是《When AI builds itself》。这篇文章谈的是另一件更大的事:AI 正在参与构建下一代 AI。
一边是资本市场,意味着更高估值、更强融资能力、更大的商业压力。另一边是安全警告,Anthropic 说,如果 AI 继续加速参与自身研发,未来可能需要让社会保留一种选择:在必要时,协调放缓甚至暂停最前沿 AI 的开发。
一个正在加速上市的 AI 公司,同时提醒世界:加速度本身值得警惕。
有人会说,这是安全意识。有人会说,这是 IPO 前的叙事包装。也有人会怀疑,这会不会变成大公司用“安全”限制后来者的理由。
乍看起来这些争议都合理。
但如果只停在“它到底真诚不真诚”,就容易错过更重要的变化。
《When AI builds itself》真正值得普通人和工程师关注的地方,不在它喊了什么口号,而在它公开了一组内部数据。
这些数据说明一件事:AI 正在先吞掉执行。
Anthropic 在文章里说,截至 2026 年 5 月,Anthropic 合并到代码库里的代码,超过 80% 由 Claude 编写。
在 Claude Code 于 2025 年 2 月进入 research preview 之前,这个比例还只是个位数。
它还提到,2026 年第二季度,典型工程师每天合并的代码量,已经是 2024 年的 8 倍。
这里要先加一句提醒:这些数据来自 Anthropic 自己的统计,不等于第三方审计结论。代码行数也不等于真实生产力,Anthropic 原文里也承认这一点。
但即便把水分扣掉,趋势依然清楚。
AI 已经不再只是帮工程师补几行代码、解释一个报错、生成一个函数。
它开始进入更完整的工作链路:读上下文、改文件、跑代码、看结果、继续修。
原来人和 AI 的关系更像“我问一句,你答一句”。
现在更像“我给目标,你去推进一段任务”。
差别很大。
前一种关系里,AI 是一个更快的搜索框。
后一种关系里,AI 开始像一个可以接任务的执行单元。
Anthropic 文章里还有一个更关键的判断:AI 能够独立完成任务的时间跨度,正在变长。
它引用的趋势是,AI 系统可靠完成任务的时长,大约从 7 个月翻倍一次,缩短到 4 个月翻倍一次。
2024 年 3 月,Claude Opus 3 大约能处理人类 4 分钟的软件任务。一年后,Claude Sonnet 3.7 能处理约 1.5 小时的任务。再往后,Claude Opus 4.6 已经能处理 12 小时级别的任务。
如果这个趋势继续,2027 年,AI 可能开始覆盖一些人类需要数周才能完成的工作。
这就是 Anthropic 所说的 recursive self-improvement,递归自我改进。
意思是,当 AI 能够越来越多地参与 AI 自身的研发,写训练代码、跑实验、分析结果、优化流程,未来就可能出现一个更强的闭环:AI 帮助做出下一代更强的 AI。
Anthropic 很谨慎地说,现在还没有真正进入完整的递归自我改进,它也不认为这件事必然发生。
但它认为,这个可能性来得比多数机构准备得更早。
这句话听起来像安全警告。
放到普通人的工作里,它其实还有另一层含义:很多岗位的变化,可能会先从“AI 接管大量执行环节”开始,直接替代反而未必是最早出现的形态。
执行被自动化以后,人的位置会发生变化。
过去,一个工程师的大量时间花在写代码、修 Bug、查日志、补测试、改文档上。
现在,越来越多这类任务可以交给 AI 先跑一轮。
过去,一个内容创作者的大量时间花在找资料、列提纲、写初稿、改排版上。
现在,AI 也能把这些环节先铺出来。
很多人看到这里,会自然想到一个问题:那人还剩什么?
我觉得答案可以落到三件很具体的事上。
第一,定义问题。
AI 可以帮你写很多代码,但它不知道这个需求该不该做,也不知道这个需求做到什么程度就够了。
AI 可以帮你写一篇文章,但它不知道这篇文章该不该发,也不知道它和你长期想建立的内容系统有什么关系。
第二,验收结果。
执行变快以后,垃圾结果也会变多。
以前一个人一天只能写几百行代码,问题暴露得慢。现在 AI 一下午可以改几十个文件,如果没有验收标准,错误也会被放大。
内容也是一样。AI 可以快速给你 10 个标题、3 个开头、1 篇初稿,但真正决定质量的,是你能不能看出哪些地方是假大空,哪些地方事实不稳,哪些地方偏离主线。
第三,沉淀资产。
一次性让 AI 帮你写一段东西,只是消费。
把这次写作过程里的判断标准、资料来源、结构模板、审校清单留下来,下一次还能复用,这才开始接近生产系统。
这也是 Human3.0 里最重要的一条线:人不能只做 AI 输出的消费者,要逐步拥有自己的数字生产资料。
我更关心的,其实是 Anthropic 这组数据背后的分工变化。
当 Claude 写了超过 80% 的合并代码,人的价值并没有自动消失。
但人的价值会从“我亲手写了多少”转向“我能不能驾驭更大的工作面”。
这对工程师尤其明显。
以前,熟练度很重要。你会不会写某种框架,会不会调某个库,会不会把一个报错快速查出来,这些都能直接决定效率。
现在,这些能力仍然重要,但它们开始变成基础条件。
更高一层的问题变成:
这个需求边界是否清楚?
这个改动会不会影响现有接口?
这个测试能不能证明关键路径真的跑通?
这个方案是临时补丁,还是值得沉淀成一套流程?
这些问题,AI 可以辅助回答,但最后不能替人负责。
内容创作也是同样的逻辑。
AI 能写一篇很顺的文章,但它很容易写成“正确废话”。
它会给出完整结构,也会给出流畅结论,但不一定知道你真正要建设的是哪条主线。
如果你没有自己的判断框架,AI 越强,你越容易被它带着跑。
它给你十个方向,你觉得每个都不错。
它给你一篇初稿,你觉得好像能发。
它给你一堆素材,你觉得都值得保留。
结果就是,产量上来了,系统没有变强。
所以,普通人现在更应该做的,是少追一点新模型的热闹,多建立一点自己的工作秩序。
更有用的是,给自己的工作建立三张清单。
第一张,问题定义清单。
每次使用 AI 前,先写清楚:我要解决什么问题,为什么值得解决,什么结果算完成,哪些边界不能碰。
这张清单决定你有没有方向盘。
第二张,验收清单。
AI 给出结果以后,不要只看它像不像、顺不顺、完整不完整。
要看事实是否可靠,逻辑是否闭合,关键路径是否验证,输出是否符合你的长期目标。
工程里是测试、日志、接口合同、回归路径。
内容里是来源、主线、读者获得感、可沉淀价值。
第三张,资产沉淀清单。
每次完成一个任务,都问一句:这次有没有东西值得留下来?
比如一个 Prompt、一个模板、一个检查表、一个资料索引、一段可复用观点、一个案例卡片、一套发布流程。
如果没有沉淀,每一次 AI 协作都只是更快地完成了一次消费。
如果有沉淀,AI 才开始变成你的结构杠杆。
Anthropic 一边推进 IPO,一边提醒世界 AI 可能需要踩刹车,这件事当然有它的商业意味。
但商业意味并不会抵消技术变化本身。
最值得看的,是它把一个正在发生的事实摊开了:执行正在变得越来越便宜,甚至会便宜到让原来的岗位边界失效。
当执行越来越便宜,真正稀缺的东西会变成判断。
什么值得做。
做到哪里停。
哪些结果可信。
哪些东西应该沉淀。
哪些自动化会伤害人的主体性。
这些问题不会因为 AI 更强而消失,反而会变得更重要。
所以,我不太愿意把这件事只理解成“AI 要不要暂停”的争论。
对更多普通人来说,更现实的问题是:当 AI 能替你完成越来越多执行,你有没有能力决定它该执行什么?
这就是人的位置。
人更好的位置,是把事实、记忆、重复性交给 AI,把方向、责任、审美和长期判断留在自己手里。
如果 Claude 已经能写 Anthropic 80% 的合并代码,那么下一个问题就很直接了:
当你的工作里也有 80% 的执行可以交给 AI,你准备用省下来的时间做什么?
答案会决定你是在消费 AI,还是在建设自己的系统。
参考资料: