实施已廉价，"品味"才是 AI 时代最贵的能力#OpenAI Codex产品负责人

mixlab

发布于 2026-06-30 13:44:01

1610

文章被收录于专栏：MixLab科技+设计实验室MixLab科技+设计实验室

Shadow：写代码变得像发邮件一样容易的 2026 年，一个共识正在形成 ——

实施已变得廉价，品味（taste）才是最稀缺的能力。

为什么说实施已廉价？文档（需求 / 设计 / 架构 / Bug 记录）是项目核心资产，代码可以被AI随时重新生成。

品味不是工程师的专属，是 PM、设计师、研究者必须夺回的新高地。

未来 5 年，最贵的不是"造物者"，是"策展人"（也可以理解是架构师）。

OpenAI Codex产品负责人的访谈

最近，Lenny's Podcast 放出 OpenAI Codex 负责人 Andrew Ambrosino 的访谈[1]。他反复在讲同一件事：

实施（写代码、出原型）已经变得廉价，决定"该写什么、怎么做最好"的判断力才是最稀缺的资源。

Codex 桌面端周活用户（WAU）已经突破 500 万，自 2 月以来 6 倍增长；OpenAI 内部 97.9% 的员工每周都打开 Codex，不只是工程师。半年前这个数字还只有约 40%。其中 1/5 用户是非工程师，而他们的增速比工程师还快 3 倍[2]。

OpenAI 官方在 6 月 25 日发布的经济研究论文还披露了一个被低估的数字：自 2025 年 8 月起的 10 个月内，企业场景"非开发者"用户增长 189 倍[3]。

当一个原本属于程序员的工具，已经渗透进产品经理、设计师、研究员、营销人员的日常工作流时，"写代码"就从稀缺技能变成基础读写能力。

那么剩下的问题只有一个：谁来判断什么值得做？

深夜里听播客的产品人

一、品味究竟是什么？不是美学

很多人第一次听到"taste"会想到视觉风格、UI 配色、品牌调性。Ambrosino 在节目里特意否定了这个理解[1]：

品味不是审美判断。品味是"在代码变得越便宜的时代，决定写什么、怎么做最好"的判断力。

这句话我们 MixLab 早在两个月前就讲过，叫"代码越便宜，品味越值钱"[4] ：

以前：先写一份产品需求文档（PRD）→ 评审 → 排期 → 实施。流水线，每个环节都有人负责。
现在：直接用 Codex 跑多个原型 → 用 taste 判断哪个值得继续投入。

这意味着产品研发的第一步变了，从"如何说服别人这个需求值得做"，变成"在十个跑通的原型里挑出那一个真正解决问题的"。

这件事在设计行业里面发生过：建筑史上从预制装配走向参数化设计（parametric design）时，瓶颈不是造得快不快，而是建筑师的"在哪里开窗、给哪种光"这类品味判断。

OpenAI 的核心团队显然也意识到了这件事，他们在每个产品线都把"判断力"列为招聘的硬指标。

二、训练营里的真实验证：AI 帮你提炼 design.md，但判断还得自己来

Mixlab 训练营上，我和学员一起做了一轮实战 —— 把一组参考图丢给 AI，让它提炼成一份 design.md（设计系统源文件：色彩、字体、布局、间距、禁止项）。模型输出确实比 2024 年强得多：自动生成了色板、字号、组件库清单，还顺手把"不要使用过饱和的蓝色"这类隐含规则抽了出来[10]。

但我们几乎同时遇到了三处"AI 觉得没问题、但有品味的人会皱眉"的细节：

"例子有点少"。AI 提炼的卡片组件只给了 3 个变体，做过设计的人会立刻意识到，3 个不够覆盖完整场景，至少需要 6-8 个变体才能撑起一个产品的一致性。
"光晕不够明显"。AI 生成的 hero image 整体调性对，但弱化了一道高光层；这种细节非专业人士大概率直接接受，但有设计眼光的人能看出"画面不够透"。
"品牌色用得过于保守"。AI 在调色时偏向"安全色域"，结果是把原本应该鲜活的品牌色压成了"标准 SaaS 蓝"。

非专业人士大概率会直接接受所有这些结果。但有 design taste 的人会立刻指出问题，并要求重做。

更值得玩味的是工具之间的美学差距。

同一段提示词（prompt）丢给 Google AI Studio，出来的是"国际化高审美"的界面：卡片有呼吸感、留白克制、字体层级清晰。

丢给国内某些工具，出来的是"偏素、简陋"的版本：按钮没有圆角节奏、图标粗细不统一、配色像回到了 2014 年。

同样的 prompt 不同的输出，背后是训练数据和工程团队审美积累的差异。

选哪个、认不认得出好坏、敢不敢坚持"不够好就重做" —— 这靠的不是工具，是人。

这也是为什么我在训练营里反复讲一句话：

AI 让你把实施做得极度廉价，但判断产品该长什么样、什么风格契合品牌、什么细节该强化或删减 —— 这些审美决策与品味判断是专家才有的，无法被 AI 替代。

DESIGN.md 这个新格式真正颠覆的是什么？

它让"沉淀设计系统"从一项手工劳动变成了 AI 可读的源代码（是的，DESIGN.md 之于设计系统，就像 Markdown 之于文档）[10]。

这是设计师的解放，不是设计师的末日。

当设计系统可以被版本控制、跨工具流转、被 Claude Code 直接读取时，资深设计师的工作从"画图"变成了"定调子、定标准、定禁止项"。

AI 把"动手"的环节廉价化，人必须把"判断"的环节升级。

你相信未来所有公司都是Agentic公司吗？

设计师在白板前审阅 AI 设计稿

三、交叉学科

品味为什么突然变稀缺？

认知科学：模式识别 ≠ 价值判断。2026 年的前沿模型能在毫秒级内识别视觉模式、代码结构、用户痛点文本，但"识别"和"判断"在认知科学里从来就是两件事。前者是模式匹配，后者需要前额叶皮层参与的价值排序。

"AI is still bad at design"，它能生成 100 种按钮排列，但不知道"哪一组让用户产生信任"[1]。

设计伦理：决策归责不能外包。当 Codex 桌面应用 7+ 小时自治执行、能写一整本定制儿童绘本、能自动签合 PR 提单时，出错的责任链必须有人类站在终点[1]。MixLab 反复强调的"七种用户控制力设计范式"（可解释输出、置信度显示、干预机制、渐进式披露、边界感知、协作模式、记忆控制） [5] —— 这些范式的共同点是把"判断回路"显性化，因为 AI 永远不能替人签字。

组织行为学：从职能隔离到区域联防。Ambrosino 描述了 Codex 团队的玩法：成员之间不按"产品经理 / 设计师 / 工程师"划分边界，谁手上缺人就补上[1]。但他同时警告：

判断力的深度需要几千小时积累。

你可以用 AI 写 10 倍的代码，但不能用 AI 加速 10 年的审美训练。

这件事对教育的冲击可能比对就业的冲击更大 —— 未来 5 年，"会写代码"不再是稀缺品，"看得准"才是。

认知科学、设计伦理、组织行为学三学科交汇

四、Codex 6x 增长背后

数据本身值得看，但更值得看的是数据背后的产品判断。

500 万周活、6 倍增长、97.9% 内部采用 —— 这些数字不只是 Codex 团队的成绩单，它们揭示了 OpenAI 的整体战略：

Super Bowl 广告选了 Codex 而不是 ChatGPT[6]。这是一家原本以聊天机器人闻名的公司，把"写代码的工具"放到了最贵的展示位。
Codex 与 ChatGPT 的 Home Base 整合[1]。Codex 不是另一个 App，是指挥所有智能体（Agent）的控制台。
$20/月 ChatGPT Plus 即可使用[3]。商业化路径刻意做低门槛，把"全民知识工作工具"作为目标市场。

我们是否会把所有 SaaS 装进 Codex 里？

Ambrosino 没有否认[1]。

这才是品味发挥作用的地方：当所有实施成本归零，下一个护城河就是"整合停在哪里？"。

判断力差的团队会造出 200 个"AI 增强"功能互相打架；判断力好的团队会克制 —— 只留 5 个用户真正离不开的入口。

顺便说一句，Anthropic 的 Claude Code 走的是命令行界面（CLI） + 集成开发环境（IDE）路线，主打工程师工作流[7]；Cursor 走的是 IDE 内的 Copilot 进化路线。三家形成清晰差异化 —— 但共同点是：coding agent（编程智能体）已经成为大模型公司的新主战场。

而在这场战争中，决定胜负的不是谁的模型更大，而是谁家的产品经理更有 taste。

五、品味不会让专家消失

如果你正在焦虑"AI 会不会让 PM/设计师/初级工程师失业"，大可不必。

Ambrosino 在节目里给了一个非常具体的反例—— 他自己用 Codex 做了 60+ 自动化任务（自动解决合并冲突、生成每日工作简报、给两个女儿做定制绘本、给团队监控竞品营销）[1] [6]。

但他并不是一个"被 AI 解放的全能选手" —— 他的核心能力是知道该让 AI 自动化什么。

能把一个想法从概念做到完成、并且带着高品味和主动权的人[1]。

这意味着：

不会被冲击的：有 5 年以上深度积累的 specialty（资深工程师、资深设计师、资深 PM）、能跨边界做判断的人。
会被冲击的：以"执行"为单一价值的中间层 —— 尤其是那种"按部就班把需求转成任务卡"的初级产品经理。
反而会升值的：有跨学科视野、能用 AI 把判断力放大 10 倍的人。

不是 AI 取代人，是人的判断跟不上 AI 的执行速度[8]。

瓶颈不在 AI 哪里不够强，在人类哪里不够快、哪里不够准。

所以训练判断力比训练编码更紧迫。

关于人才画像，Claude Code之父也提到了类似的：

六、60 个常驻 Agent 跑在一个人的工作流里

讲个技术细节。Ambrosino 详细列了他那 60 多个常驻 Codex 自动化任务[6]，大致可以分成四类：

PR 维护类：每小时跑一次，自动解决合并冲突、保持 PR 可合并、修复持续集成（CI）失败。
每日简报类：每天 9:00 自动汇总 Codex App 昨日合并的 PR，按主题分组。
Bug 自动修复类：团队成员共享的 automation，监控自己昨日的 PR，在别人发现你已经发布了一个 bug 之前就修掉。
内容/家庭类：用 Codex image gen + PDF skill 给两个女儿做 24 页定制故事书 —— 这件事本来要外包给插画师，现在他自己就能跑。

从架构上看，这 60 多个 Agent 是异步的 —— 它们不被流程串联，而是被状态驱动：PR 变化、PR 评论、日历时间、外部事件。每个 Agent 监听自己的触发条件，触发后独立运行。

这是一个非常清晰的个人操作系统（personal OS）雏形。

一人独角兽（估值10亿美元的创业公司）

它的核心不是"多 Agent 协作"那种花哨说法，而是用 taste 设计出 60 个真正值得自动化的任务。

对比一下 Anthropic 的 "Research Preview 快速发布机制"[9]

—— Anthropic 走的是"边发边改"路线，Codex 走的是"先有内部产品，再对外发布"路线。

两种路线背后是不同的 taste 哲学：Anthropic 押注"早发布暴露真问题"，OpenAI 押注"内部验证完再发"。

没有谁对谁错，但每一个判断都来自那个团队的 taste 累积。

60 个 Agent 围绕个人工作台

七、当算法接管了"造物"，人类还剩什么

写到这里我想说点不那么技术的东西。

我们这代人从小被训练"会造物"才有价值 —— 会画图、会写代码、会剪视频。这些是手艺。手艺在 2026 年开始加速贬值：每一个被 Codex 重新生成的界面、每一段被自动重写的脚本、每一本被 AI 绘本师拼出来的儿童故事书，都让"造物"这件事变得稀松平常。

但人之所以为人，从来不是因为会造物。 人是因为知道什么值得造而存在。

建筑史上有一个细节：密斯·凡德罗那句"less is more"不是审美偏好，是一个判断 —— 他在钢筋玻璃已经能造摩天楼的时代，选择克制。选择本身就是品味。

Ambrosino 在节目里反复用同一个词：curation（策展）。Curate 本来是博物馆和美术馆的术语 —— 在一万件作品里挑出该展出的那三十件。这个词被借用到 AI 时代特别准确。

未来 5 年，最稀缺的职业不是"会写代码的人"，而是"会策展的人"。

不只是策展艺术品，也策展需求、策展原型、策展 Agent 任务、策展团队节奏。

这也是为什么 MixLab 一直坚持做一件事 —— 把不同学科的人拉到一起实验。

原因从来不是"我们懂 AI"，而是想在算法接管一切之前，先把"判断力"这件事练起来。

在画廊里策展的人

八、品味训练

如果你也在做"用 AI 把判断力放大 10 倍"这件事，欢迎加入 Mixlab 无界社区。我们是最先触达未来的那一小部份人，正在用跨学科实验场域的方式，把"taste"这件最难的事练成肌肉记忆。

领取Agentic Coding能力等级白皮书PDF

参考

OpenAI Codex lead on the new shape of product work — Lenny's Newsletter，2026-06-28
Lenny Rachitsky Twitter 预告 — Twitter/X，2026-06-28
How agents are transforming work — OpenAI，2026-06-25（经济研究论文）
Codex is becoming a productivity tool for everyone — OpenAI，2026-06-02
OpenAI Codex 5M WAU 与非工程师 20% / 3x 增长数据 — Techjack Solutions
OpenAI Codex Data Shows Non-Developers Now Driving Enterprise AI Agent Surge — TechTimes，2026-06-26
OpenAI Codex Super Bowl 2026 TV Spot, "You Can Just Build Things" — iSpot.tv，2026-02-08
Thibault Sottiaux + Andrew Ambrosino 完整引述（60+ 自动化任务清单） — Every AI&I Podcast，2026-03-17
Boris Cherny: What happens after coding is solved — Lenny's Newsletter，2026-02-19
Alexander Embiricos: Why humans are AI's biggest bottleneck — Lenny's Newsletter，2025-12-14
Mixlab: 产品品味 Product Taste 定义（来自 Cat Wu 访谈沉淀） — Mixlab knowledge
Mixlab: AI 产品设计范式之七种用户控制力 — Mixlab knowledge
Mixlab: DESIGN.md 时代设计系统成为 AI 可读源文件 / 2026 训练营现场验证 — Mixlab knowledge
Cat Wu: Research Preview 快速发布机制 — Lenny's Newsletter（Mixlab 沉淀）

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-29，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自无界社区mixlab 微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度