首页
学习
活动
专区
圈层
工具
发布

美团发布万亿参数大模型LongCat-2.0,首个国产五万卡集群全流程训推,SWE-bench超越GPT-5.5

6月30日,美团发布万亿参数大模型LongCat-2.0并宣布开源,这是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型。

美团自2023年起与国产算力厂商共同推进“模芯协同”研发,逐步攻克万卡级容错恢复、NPU确定性计算、算力利用率提升等核心难题。据美团披露,团队将月均日故障率降低70%以上,训练MFU提升1.5倍,实现稳态日吞吐超1T tokens。

LongCat-2.0采用MoE架构,总参数1.6万亿,平均激活约480亿,动态范围33B~56B。模型引入业界首创的零计算专家机制,可实现Token级动态计算预算——简单Token不消耗算力,复杂Token自动激活更多专家。同时采用LSA稀疏注意力机制,将长文本计算量从平方级降至线性级,原生支持1M超长上下文。

评测数据显示,LongCat-2.0在SWE-bench Pro中取得59.5分,超越Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)和Claude Opus 4.6(57.3);SWE-bench Multilingual得分77.3,与Claude Opus 4.6(77.8)处于同一水位;Terminal-Bench 2.1达70.8。预览版此前以匿名方式上线OpenRouter平台,截至月底总调用量挤身全球前三,在Hermes、Claude Code、OpenClaw的月调用量分列全球第一、第二和第三位。

LongCat官方宣布,将于近期在多平台同步开源Infra框架、推理引擎、模型参数等核心技术。LongCat-2.0的落地证明国产算力已具备支撑前沿级万亿参数模型稳定训推的工程能力,“国模+国芯”全栈协同迈出实质性一步。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OwQqlV3YGxZFsHYcvoyWturg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券