沃顿商学院教授Ethan Mollick测试了新一代模型Claude 5 Fable。Fable能自主工作近10小时,自己拆解任务、甚至派生出子Agent去查资料和写代码。Mollick感叹,人类的角色已经从“用提示词操控AI的巫师”,变成了“只看结果的赞助人”。
但硬币的另一面是,程序员们在评论区无情开麦:AI自主生成的代码和地图看起来很美,实则漏洞百出,比如它画的交通图充斥着不存在的航班。
这里的底层逻辑是:当AI从“工具”演变为“外包团队”,人类确实省力了,但代价是失去了对中间过程的掌控。你很难验证一个运行了10小时的黑盒到底塞了多少垃圾代码。未来的核心竞争力,或许不再是你会不会写代码,而是你有没有能力去审计和验收AI给出的结果。
www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos