别晒 token 了，先算算 token ROI

曹犟

发布于 2026-05-08 19:43:26

2040

你好，我是曹犟。

最近朋友圈里，晒 token 用量的人明显多了起来，时不时有人晒截图：这个月又用了多少亿 token。

自媒体也喜欢包装这类故事，比如某个开发者因为 Claude Code 用量巨大，成了“AI 编程标杆”；某些企业内部也开始统计团队和个人的 AI 使用量，甚至做成排行榜；连黄仁勋也公开鼓励工程师多消耗 token。

这些声音放在一起，好像就在传达一个信息：token 用得越多，才越像一个认真拥抱 AI 的人。

但我的观点是：消耗量大并不代表什么，消耗大量 token 不等于解决大量问题。与其比消耗量，还不如看 token ROI。

PART01：为什么大家会追求 token 消耗量？

这也正常。新工具刚出现时，大家总会先抓最容易量化的东西来衡量来比较。就好像过去是比较每天在线多久、写了多少行代码、开了多少场会，现在变成了比较消耗了多少 token。

为什么这个数字这么容易被追捧？原因很简单：它好统计，好比较，还能给人一种“我也参与进来了”的感觉。别人晒出一个更大的数字，你很难完全不受影响。焦虑是最容易被收割的人类情绪之一。

而 AI 真正带来的变化，往往不太好晒。比如一个人用 AI 改造了自己的工作方式，缩短了调研时间，提高了代码质量，降低了试错成本。这些事情当然更加重要，但很难马上变成一个可以炫耀的数字。

相比之下，token 消耗量太简单了。它可以被统计，可以被排名，于是很容易被误认为是“AI 使用深度”的替代指标。

这并不新鲜。过去很多组织也喜欢统计类似的数字：程序员写了多少行代码，销售打了多少个电话，员工加班到几点，会议开了多少场，文档写了多少页。这些数字不是完全没有意义，但如果把它们当成最终目标，就很容易走偏。

更形象一点说，现在比较 token 消耗量，和前几年比较自己每天的日历有没有被会议排满，本质上是一回事。它们都把“看起来很忙”的过程指标，误当成了“真正创造价值”的结果指标。token 消耗量也是一样，它只能说明 AI 参与过，不能说明最后产出有多好。

PART02：消耗大量 token，不等于解决大量问题

这是我最想强调的一点：token 消耗量是成本，不是成果。

一个人消耗了很多 token，可能是在解决复杂问题，投入本来就该高；也可能是在低效重复，token 都花在了无效沟通和反复返工上；也可能只是在把低价值任务“AI 化”，表面上看着很热闹，实际根本没啥产出。

所以，不能简单地把“高 token 消耗”理解成“高 AI 能力”。很多时候，真正熟练的人会先把问题拆小，把背景材料整理清楚，再决定是问模型、写脚本，还是直接自己做，而不是单纯把对话越拉越长。

可以类比之前的云计算时代：一个团队花了很多云资源，不代表技术先进，也不代表业务增长好。云账单很高，可能是业务规模真的大，也可能是架构设计没做好。token 也是一样：有些高消耗是在做高价值探索，有些只是用很高的成本换一个普通结果。

所以，问题不在于 token 用得多，而在于它有没有换来相应的结果。

PART03：更好的指标是 token ROI

如果一定要找一个指标来衡量 AI 使用的效果，我觉得比 token 消耗量更有价值的是 token ROI。

ROI 是投资回报率。放到 AI 使用里，我理解的 token ROI 就是：这些 token 加上配套的人力成本，最后换回了多少有效产出。

可以粗略写成一个公式：token ROI = AI 带来的有效收益 / AI 使用的综合成本

收益可以很具体：少花半天调研时间、方案质量更好、试错成本更低，或者多验证出一个原来没机会验证的方向。

成本也不只是 token 价格，还包括写 Prompt、整理上下文、验证结果、维护 harness，以及 AI 出错后带来的返工。

这个判断不是凭空来的。之前几篇文章里，我其实从不同角度碰到过类似问题。

在《三个 40 岁老程序员决定用 AI 重新出发（二）：用 AI 写商业计划书》里，我提到过，做 Agent 创业要尽量选择 token ROI 足够大的行业，否则就可能沦为 token 的转售商。在《三个 40 岁老程序员决定用 AI 重新出发（六）：Skill、Harness 和代码护栏》里，我也写过，我们之所以选择切入营销预算，正是因为这个领域的 token ROI 足够高。再比如《给 AI 装上外挂记忆：我的个人知识库搭建实践》里提到，中文引号修正、格式检查、文件归档这类重复操作，与其每次都让 AI 重新处理，不如固化成脚本。

所以判断一个场景值不值得用 AI，需要优先看几个很朴素的问题：任务本身值不值钱，AI 能不能明显降低成本，结果是不是容易验证。如果这个场景还会反复发生，并且用完之后能沉淀出模板、脚本或经验，那它的 token ROI 通常不会太差。

反过来，如果任务本身不重要，结果也很难验证，用再多 token 也只是低 ROI 的忙碌。

不是要少用 token，而是要提高 token 的投资回报率。

PART04：怎么判断 token ROI 高不高？

具体到日常工作里，可以看下面几件事。

第一，工作流是不是真的变了。

我说的工作流变化，不是把搜索引擎换成聊天框，而是工作中的某些环节因为 AI 被重新设计了。可能是原来要花半天的调研现在半小时能出初稿，可能是原来串行等审批的流程现在可以并行推进，也可能是原来因为成本太高被直接跳过的环节现在被补了回来。

比如写代码前，先让 AI 帮你把边界条件列一遍；写完代码后，让它补一轮测试；写方案时，让它同时生成三个版本来比较；开会前，让它把背景材料和分歧点整理出来。这些变化，比单纯多聊几轮有意义得多。

第二，结果有没有变好。

一个很简单的检验方法是看交付物：调研是不是更快形成了能讨论的初稿，方案是不是能多比较几个版本，代码是不是少漏了一些边界条件。如果 token 花了很多，最后产出的东西和过去差不多，那就要警惕了。

第三，有没有开始做过去做不了的事。

这一点我觉得最有意思。很多事情以前不是没有价值，而是人手不够、时间不够，所以只能先放着。比如系统整理用户反馈、快速理解陌生代码库、把零散想法持续整理成文章和课程。