
这两年,大模型最大的变化,不是“谁最强”。
而是:已经没有一个模型,能把所有事都做成第一。
你写代码,可能会先想到 Claude。 你做日常办公和综合问答,很多人会选 ChatGPT。 你要多模态、生态和搜索联动,Gemini 变得越来越强。 你要低成本大规模调用,DeepSeek 和 Kimi 的性价比很有竞争力。 你想试试更强的长上下文和 agent 能力,Grok 也在快速追。
所以今天这篇,不聊“神话”,只聊三件事:
第一,现在主流、而且确实好用的大模型有哪些; 第二,它们分别适合什么场景; 第三,普通用户和开发者,分别要花多少钱。
先说结论:
如果你是普通用户,够用的选择其实就 3 类:
如果你是开发者,选型逻辑更简单:
OpenAI 现在的产品层次已经很清楚了。
在 API 侧,官方目前重点给出的是 GPT-5.4、GPT-5.4 mini、GPT-5.4 nano,其中 GPT-5.4 被定义为“面向专业工作的最强模型”,mini 更偏向编码、计算机使用和子代理,nano 则主打高吞吐、低成本。
在 ChatGPT 订阅侧,OpenAI 官方写得也很直接: ChatGPT 有 Free、Go、Plus、Business、Enterprise 等层级,付费套餐按月/按用户收费;Business 和 Enterprise 面向团队与企业,个人套餐价格会根据地区展示。OpenAI 还明确写到,免费版对所有人开放,Go 也已经在全球更多国家推出。
一句话评价就是:
你不知道先选谁,先用 ChatGPT,大概率不会错。
它的优点不是某一项绝对碾压,而是综合能力、产品完成度、生态、插件/工具链、语音/图像/搜索/数据分析整合得最成熟。
Anthropic 这条线,最大的优势一直很稳定:代码、长文档理解、严谨写作、agent 化执行。
从官方页面看,Anthropic 现在重点模型包括 Claude Sonnet 4.6、Opus 4.6、Haiku 4.5。其中:
如果你的工作是:
那 Claude 依然是非常稳的选择。
很多人以前对 Gemini 的印象是:“能用,但不一定是首选。”
但现在这个印象得改。
Google 官方当前 API 定价页给出的重点模型之一是 Gemini 3.1 Pro Preview,而且 Google 把它定义成面向多模态理解、agent 能力和编码的先进模型。免费层、付费层、企业层也区分得很明确。
Gemini 这一家的真正优势,不只是模型本身,而是:
所以如果你本来就重度使用 Google 体系,Gemini 的顺手程度会很高。
如果只看“花多少钱,拿到多大能力”,DeepSeek 还是绕不过去。
官方文档显示,当前 deepseek-chat 和 deepseek-reasoner 对应的是 DeepSeek-V3.2,128K 上下文;价格非常激进:缓存命中输入 0.2 元 / 1M tokens,缓存未命中输入 2 元 / 1M tokens,输出 3 元 / 1M tokens。
这个价格放在今天看,依旧很能打。
所以 DeepSeek 的定位很清楚:
不是最全能,但很适合“预算敏感、调用量大、中文任务多”的团队。
尤其是客服、知识库问答、批量摘要、结构化抽取、内容加工这类场景,DeepSeek 的投入产出比很高。
Kimi 这半年最大的变化,是它不再只是“长文本产品”。
官方文档现在主推 kimi-k2.5,支持 256K 上下文、多模态理解和 Tool Calling;同时还有 K2 系列和更早的 Moonshot-v1 系列。
定价上,kimi-k2.5 现在是:
这意味着什么?
意味着 Kimi 现在已经从“适合看长文件”,升级成了“能做 agent、能做视觉、能做代码、还能兼顾中文体验”的综合型国内选手。 对很多国内团队来说,它会是一个很务实的选择。
xAI 这条线现在的关键词,不只是 Grok,而是 工具调用体系。
官方文档显示,Grok 4.20 是当前旗舰模型之一,支持推理,给出 2,000,000 context window;同时,xAI 对 Web Search、X Search、Code Execution、File Search 等工具也有单独计费。比如:
这说明 xAI 在往一个很明确的方向走:
不是单纯卖一个聊天模型,而是在卖“模型 + 工具 + agent”这一整套能力。
如果你是开发者,尤其是想做自动检索、自动执行、多工具串联,这家值得关注。
这里我把收费方式分成两类讲。
这个最好理解,就是你每个月交一个会员费。
OpenAI 官方明确写了,ChatGPT 有 Free、Go、Plus、Business、Enterprise 等档位;其中 Business 是每用户每月收费,Enterprise 需要联系销售,个人档价格以 ChatGPT 页面和地区展示为准。官方 FAQ 也明确说,免费版对所有人开放,Go、Plus、Business、Enterprise 都是按用户/月计费。
Anthropic 官方站点目前明确展示了 Max plan、Team plan、Enterprise plan 等产品线;不同计划的核心区别是可用额度、协作能力和企业能力。Anthropic 此前也明确发布过 Max 计划,主打更高使用上限。
xAI 官方首页显示,Grok 提供 SuperGrok 订阅,并新推出了 SuperGrok Heavy,主打更高限额和更强访问能力。
这两家更常见的付费方式,还是围绕 API 和增值能力,而不是像 ChatGPT 那样把个人订阅体系做得最强势、最全球化。Kimi 官网强调的是产品体验和开放平台;DeepSeek 公开文档重点也是 API 计费。
所以,普通用户的付费逻辑很简单:
这个就是 API 模式。 你不用买“会员”,你是按 tokens、调用次数、工具使用量付费。
我把几家最值得看的价格,直接列出来。
很多人一看到大模型价格表,第一反应是:
“DeepSeek 这么便宜,那是不是就该无脑选它?”
不是。
因为大模型不是买白菜。最贵的,不一定最适合你;最便宜的,也不一定总成本最低。
举个简单例子:
一个模型单价便宜,但它经常答偏、返工率高、工具调用差,那你的人力成本和流程成本,最后可能更高。 反过来,一个模型贵一点,但它能一次做对、还能自动调用工具、把复杂流程跑通,最后总成本反而更低。 这也是为什么 OpenAI、Anthropic、Google 这些厂商,不只在卷 token 价格,更在卷“可落地能力”。
所以,真正实用的选型方式,不是问:
“谁最强?”
而是问:
“我最常见的那 3 个任务,谁做得最好?”
直接从这三个里选:
优先顺序我会这么排:
不要只看模型分数。 重点看四件事:
这也是为什么 OpenAI、Google、Anthropic 都在把企业版、安全、管理员控制台、批量计费、合规能力单独拎出来卖。
2026 年的大模型市场,已经不是“谁会替代谁”的问题了。
更现实的答案是:
你大概率会同时用 2 到 4 个模型。
一个做主力问答, 一个做代码, 一个做低成本批处理, 再加一个做搜索、图像或 agent。
未来的竞争,不只是模型参数有多大。 而是谁更像一个真正能干活的数字员工。 谁的价格,不只是便宜; 而是便宜到能让你真的大规模用起来。
这才是今天看大模型,最值得关注的事。