写给:对着光标发呆的人
屏幕上的光标在闪,一闪一闪,像一只耐心的眼睛盯着你。你不是没东西要写,你只是不知道从哪落笔。脑子里有一堆想法挤在一起,谁也不肯先出来。
如果你做过设计,做过研究,做过任何一个"得从零开始"的工作,你一定认识这种时刻。它有个名字 —— 空白页焦虑。做错一道题至少知道有个答案在那,空白页连方向都没有。
这种瘫痪感,比失败更折磨人。
然后 AI 来了,焦虑换了一个形式。
以前的痛点是"我写不出第一句",现在的痛点变成"AI 给了我十种开头,我要选哪个?" —— 还有更糟的,AI 写得太像样了,你回头看自己原来想说的那些,反而觉得不值得说。
这一章写给所有面对空白页的人:创作者、设计师、写作者、做研究的人。
接下来的四节,我想把"从发散到深化"这件事拆开讲。
我不打算说服你别用 AI,那不现实。
我只想让你知道一件事 ——
AI 能加速你发散,但深化和品味,只能你自己来。
空白页不是没答案,是问题还没形成。
用户面对 AI 最大的障碍,往往不是不知道按钮在哪,而是不知道第一笔该画在哪里 —— "空白页焦虑"比做错一道题更让人瘫痪。
2024 年我跟薛志荣合著《人人皆可 Vibe 编程》那段时间,我憋了2周才落笔。
每天打开文档光标闪一小时不动,Word 里始终只有 6 个字 —— 脑子里不是没东西,是从哪个角度切都不对。后来发现,问题不是"我写不出第一句",是"我还没弄明白我要告诉谁"。把开头从"我想表达什么"换成"读者会卡在哪",几万字几小时就写完了(思路想好,填充交给AI)。
大多数 AI 工具只帮你"发散",真正花时间的是"深化" ——
一个方向有了,怎么把它变成具体的研究问题、方法、评估标准?
IdeaSynth(研究想法如何从模糊到成型,曾获 CHI 2025 最佳论文奖,配套的工具叫 IdeaSynth)把这个过程拆成四个格子:
问题、方法、评估、贡献,然后让 AI 帮你在每个格子里迭代。
它承认了创作的真实节奏:
不是一气呵成,而是来回磨。
Beyond Code Generation(研究"超越代码生成:探索设计空间")从另一个角度揭开了"空白页"问题:代码生成 LLM(Large Language Model,大语言模型)默认提供的是点解决方案,而非设计空间。
配套的 PAIL IDE(一个让 AI 在编程时主动呈现"替代方案"的开发环境)通过生成替代方案、追踪设计决策,让 100% 用户发现了至少一个之前未考虑过的设计方向。
说穿了,核心洞察只有一句:AI 的默认输出是一个答案,而设计需要的是一堆可能性。
如果你做过设计,你会知道:你真正缺的从来不是"那个最好的方案",而是我还不知道原来有这些方案。
品味注记:空白页没有答案,是因为问题还没成形。好的智能体帮你把"我不知道该问什么"逼成我想解决 A,但得先弄清楚 B。

达芬奇画了几百张鸡蛋的素描,不是为了交作业,是为了在画的过程中搞清楚光影到底怎么运作 —— 草稿是思考的材料,不是思考的终点。
我读同济研究生那几年,全专业 30 多号人坐阶梯教室,设计课老师开口就是一句:"先画二十张再来讨论。"当时觉得老师脾气差,后来做毕业设计才发现,那 20 张根本不是练手,是要我们画到问题自己从笔尖冒出来。
我那张获优的毕业作品,是在第无数张之后才找到的灵感。
画室里的草稿不是失败品,是问题逐渐显形的过程。
达芬奇画了几百张鸡蛋的素描,不是为了交作业,是为了在画的过程中搞清楚光影到底怎么运作。AI 辅助创意也是这个逻辑:
你要先动手,才能发现问题在哪里。
先想再画是神话,先画再想才是常态。
ClearFairy(研究"让 AI 学会记录专家推理过程"的论文)展示了什么叫先画后想:让 AI 给专家的决策过程建模。它不记录专家说了什么答案,而是记录专家在得出答案之前问了什么问题、考虑了哪些因素、为什么排除了某个方向。系统把这些推理步骤(How+Why)喂给 AI 后,强解释比例从 14% 飙升到 83%。
差别不在 AI 更会写了,在 AI 不再只是给答案,而是在展示推理轨迹。
Can Good Writing Be Generative(研究"好文章能否由 AI 生成"的论文)提出了更尖锐的问题:MFA(Master of Fine Arts,艺术硕士,美国常见的写作研究生学位)写作课的学生发现 AI 写的东西比他们的同学更像"好文章" ——
更流畅、更没有废话。
但这也暴露了价值危机:
等到 AI 能写出比大多数人类更"流畅"的文章,什么才是人类写作的不可替代性?
我的答案是:独特的经历、鲜明的观点、只有你经历过才能写出来的细节。这些东西不在数据里,只在记忆里,所以 AI 生成不了。
品味注记:画室里的草稿不是失败品,是问题逐渐显形的过程。AI 能帮你画得更快,但画什么、为什么画,还得你自己来。

拐杖发明了五千年,没听说谁因为用拐杖腿变细的 —— 因为拐杖是辅助你走路,不是替代你腿的功能。
但 AI 不一样,AI 如果替你把"想清楚"做了,你的脑子就会开始退化。
Differences in Individual Metacognitive Awareness 追踪 157 名知识工作者使用 AI 辅助工具两年后的认知表现:高元认知水平的人,用不用 AI 差不多;低元认知水平的人,用了 AI 之后在没有 AI 的情况下独立完成任务的能力显著下降。
原因在于被动纠错:
当工具直接给出正确答案,低元认知用户会跳过"我原来为什么错"这个环节。
大脑理解错误原因、然后更新记忆,这个过程被跳过了。
就像背单词用 APP(手机应用)报听写:你写对了,但你可能只是肌肉记住了手怎么动,而不是真的记住了这个词。
Rely-Not-Rely(研究"如何让用户不过度依赖 AI"的论文,曾获 CHI 2025 Honorable Mention 荣誉提名奖)从另一个角度证实了这件事:研究测试了各种防止用户过度依赖 AI 的方法 —— 标红不确定性提示、隐式回答、静态免责声明。结果发现一个都没用:
所有干预手段都同时减少了正确建议和错误建议的采纳。你挡了错的,顺带也把对的挡了。
也有例外:
一句简单的请核实此信息,用户听到后不是不信任,而是像被提醒了一下"先想再点"。
品味注记:好智能体像健身教练,逼你多做一组;坏智能体像轮椅,让你忘了自己还会走路。

自动化可以执行,不能替人承担后果。
一个成熟的智能体系统,必须知道什么时候停下来,把方向盘交还给人。
说穿了,这是责任问题,不是功能问题。
Cocoa(研究"人与 AI 共同制定计划与执行"的论文,CHI 2026 最佳论文奖)展示了什么叫"编织式"的计划与执行:
把 AI 任务拆成可以单独运行的区块,用户自然地把战略决策留给自己、把信息检索交给 AI。
更关键的是,用户把 AI 的输出当检查点,看完中间结果才决定下一步,而不是让 AI 从头跑到尾。
这个习惯,在你没察觉的时候,救了你。
Perspectra(研究"多 agent 辩论中如何呈现不同视角"的论文,CHI 2026 Honorable Mention 荣誉提名奖)提出"建设性摩擦"的概念:
多智能体辩论时,如果 AI 之间观点不一致,用户反而更愿意动脑子想想谁说得对。
关键在于分歧要能被解释。
未解释的分歧容易变成"破坏性分歧",两人吵起来,互相觉得对方是傻子;
有解释的分歧才能变成"建设性分歧",吵的内容是具体的,最后发现有一个分析框架更合理。
Proactive Agent Roles(研究"主动型 AI 应该扮演什么角色"的论文)揭穿了一件反直觉的事:
表现最客观的引导者 AI 被用户评价为"最没用",因为它不给答案,只是问你问题,逼你自己想;
而表现最差的同伴 AI 最受好评,因为它直接给答案,用户有"顿悟感"。
但看业务数据,引导者 AI 在高压任务里才是真正能打的。
顿悟感是奢侈品,关键时刻你得真能扛事。
From Fragmentation to Integration(研究"隐私管理从分散到交给 AI 整合"的论文)把这件事推到极致:
研究里发现用户信任 AI 处理隐私的准确性甚至高于自己手动操作,愿意将控制权完全让渡给智能体。
但"省事的信任"同时创造了新的风险:单点故障、丧失自主意识、利益冲突。
把全部身家交给一个"可靠"的人,听起来高效,实际是另一种脆弱。
Conversational Agents on Your Behalf(研究"AI 代你说话时会发生什么"的论文)给了一个更具体的反直觉发现:
完全自动化让用户专注副任务;但共享自主权反而让用户必须持续监控智能体发言,认知负担未减轻,多任务表现无提升。