同一问题,有时要“秒回”,有时要“想透”,你不想每次手算预算。
【出处】Anthropic API release notes 写明:effort 现已 GA,并在新模型上“替代 budget_tokens 控制思考深度”。


官方 extended thinking 文档也建议 Opus 4.6 用 adaptive thinking + effort,而不是旧的手动 budget_tokens。

【意思】Effort=思考力度档位:你给一个“多用脑/少用脑”的信号,让模型在成本、延迟、严谨度之间自动取舍。
【技术点】它把推理预算从“精确 token 配额”变成“意图级控制”,更适合线上产品。例:低 effort 走快速草稿与轻规划;高 effort 用于复杂排查、方案权衡、长文结构化输出。
【圈内话】开会前低档,写方案时拉满,省钱还不丢脸🙂