“我只花了 5 个小时,AI 就帮我写出了 3000 行 C 代码,性能直接碾压上一代引擎 10 倍!”
如果你在 X(原 Twitter)上看到这样的帖子,第一反应一定是:又是一个标准的大模型代码生成提效神话。但这个故事的诡异之处在于,发帖人——HVM 编程语言作者、底层系统开发者 Victor Taelin,在经历了一夜狂欢后,紧接着度过了极其痛苦的 15 个小时。
他发现,这 3000 行“完美运行”的代码中,AI 擅自编造了一整套根本不该存在的底层处理逻辑。他花 5 个小时完成了 95% 的进度,却又花了 15 个小时为 AI 毫无理由的“过度设计”填坑,而且还没填完。
Taelin 发出了灵魂拷问:“如果最终我还是要把这 3000 行陌生代码全部读完、审完,以确保里面没有弱智的逻辑陷阱……那我用 AI 到底获得了什么?除了提前分泌的那点多巴胺?”
在这场大厂疯狂攀比“代码生成速度”的军备竞赛中,Taelin 撕开了一个行业讳莫如深的伤疤:当平台将“代码产量”作为核心卖点时,被无限放大的“审查债务”、“理解债务”和“故障责任成本”,到底被谁悄悄吞掉了?
如果把 Taelin 的经历翻译成工程语言,它揭示的是 AI 编程中极其危险的一种错误模式。
人类程序员写出 Bug,通常错在自己的逻辑认知边界之内,Review(审查)时有迹可循。但 AI 生成的代码是在执行“黑盒空间”里的逻辑补全。
在 Taelin 的案例中,AI 在面对需求规范(Spec)未覆盖的空白区域时,没有抛出疑问,而是“自作主张”地假设系统需要处理一套极其复杂的函数重载(under/over-applied functions)。这套逻辑在语法上完美无缺,能编译、能跑通测试、性能还很高,但这完全是南辕北辙的“伪需求”。
这就是大模型时代的灾难级 Bug:结构化的虚假进度。
平台只会在发布会上演示前 5 小时内代码如何如瀑布般倾泻而出。但他们绝不会告诉你,在后面的 15 个小时里,开发者需要:
平台卖给你的是“生成即时满足”,但你的研发团队买回来的是随时可能引爆的“审查债务”。
这并非 Taelin 一人的个案。在代码产量飙升的表象下,“生产力到底有没有真实提升”成了一门玄学。
AI 安全研究机构 METR 进行了一项极具杀伤力的随机对照试验(RCT)。他们找来 16 位平均有 5 年经验的开源老兵,在他们最熟悉的代码库里完成真实的工程任务,并允许使用 Claude 3.5/3.7 或 Cursor 等前沿工具。
结果令人大跌眼镜:使用了 AI 工具的组,完成任务的时间反而平均慢了 19%。
更扎心的是预期反差:在实验前,开发者主观预测 AI 能让自己提速 24%。这意味着,AI 编程最擅长的其实是制造一种强烈的“我今天敲代码好快、效率极高”的主观幻觉。
然而,一旦把时间轴拉长到“完整的需求交付周期(Lead Time)”,当你把后续花在排错、重构、清理冗余 AI 逻辑的时间算进去,真实的交付时间反而被严重拖垮了。
Redis 创始人 antirez 同样热衷于用 AI 辅助开发底层系统,但他的态度极其冷峻。在花费四个月开发 Redis 新数据类型 Array 时,他对 AI 秉持着“极度不信任”的原则:不仅先写了一个月的详尽规范,对生成的代码更是逐行审查、随时推翻重来。
在 Hacker News 社区,有开发者直击灵魂地质问 antirez:“如果因为 AI 自动编程导致线上出了故障,你准备好第一个站出来承担责任了吗?”
antirez 的回答斩钉截铁:“绝对是的。自动编程绝不意味着开发者可以免除对错误的责任。”
这正是目前 AI 编程狂欢中最荒谬的错位。大模型厂商拼命鼓吹 Claude 或 Copilot 已经写了公司 80%、甚至 90% 的生产代码。但残酷的工程现实是:
代码可以是 AI 写的,但半夜两点线上宕机被 Oncall 夺命连环 Call 叫醒的、在复盘会上做 Root Cause 分析的,永远是那个活生生的人类程序员。
模型不会为你背锅。平台把“代码生成”这一步做得越丝滑、越让人放松警惕,后续因为盲目合并(Merge)而造成的系统崩溃成本就越发高昂。
当前 AI 编程平台的竞争 KPI,依然停留在粗暴的“代码产量”和“自动化覆盖面”上。各大厂都在拼价格战、拼响应倍速,试图成为开发者的默认底座。
但如果“审查成本”始终与“产出规模”成正比膨胀,这种表面的效率提升,本质上就和金融界的“次贷危机”一样:风险没有被消灭,只是被打包、推迟,最终甩给了那些缺乏严格 Review 纪律的研发团队。
对于下一代 AI 编程工具而言,“会写代码”只是入场券。真正能拿下严肃商业软件市场的,是那些能解决“理解债务”的平台。它们必须具备以下能力:
如果你只是为了分泌那点快速刷出几千行代码的“多巴胺”,那氛围编程确实很爽。但如果你想打造一个能活过半年的稳定系统,请牢牢记住:当 AI 猛踩代码生成的油门时,你不仅不能松懈,反而必须更加死死地握住架构审查的方向盘。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。