AI圈又炸了一个重磅消息。

美团正式发布LongCat-2.0——1.6万亿参数,MoE架构,原生支持1M超长上下文,预训练数据超过30T tokens。

但最炸的不是参数,是训练方式。

LongCat-2.0是业界第一个在五万张国产算力卡上完成从预训练到推理全流程的万亿参数大模型。

全程跑在国产芯片上,从训练到推理,没有用一块英伟达A100或H100。

这意味着什么?

国产算力第一次真正扛住了万亿参数模型的训练压力。

五万张国产卡,跑通了万亿模型

LongCat团队从2023年开始啃国产算力这块硬骨头。

从千卡起步,逐步攻克算子适配、通信优化、分布式稳定性。三年的时间,终于把五万张国产卡集群跑通了。

几个关键突破:

  • 通过HCCL异常处理、弹性扩缩卡和自动故障恢复,月均日故障率降低70%以上
  • 通过流水线调度、显存优化和算子级控核,训练MFU提升1.5倍
  • 稳态日吞吐超过1T tokens/day
  • 全程未出现不可逆的loss尖刺与回滚

国产芯片虽然单卡性能不如英伟达最顶尖的产品,但计算正确性和精度已经足够满足需求,可以支撑万亿参数模型的稳定训练

这不是实验室里的单次验证,是五万卡集群上的规模化生产。

性能:不只是“能用”,是“能打”

参数大不等于好用。但LongCat-2.0的性能数据确实能打。

SWE-bench Pro(编程基准,考察深层工程能力)上:

  • LongCat-2.0:59.5分
  • GPT-5.5:58.6分
  • Claude Opus 4.6:57.3分
  • Gemini 3.1 Pro:54.2分

超过了GPT-5.5和Claude Opus 4.6。

SWE-bench Multilingual上得分77.3,与Claude Opus 4.6的77.8几乎持平。

Terminal-Bench 2.1上得分70.8,体现了在真实运维与开发终端任务中的稳定执行与纠错能力。

架构层面也有看点:

  • LSA稀疏注意力机制:处理长文本时计算量从平方级降至线性级
  • 零计算专家机制:简单Token不消耗算力,复杂Token自动获得更多计算资源
  • MOPD架构:融合Agent、Reasoning、Interaction三组专家能力

全球开发者用脚投票

LongCat-2.0预览版此前以匿名方式接入了全球最大的大模型API路由平台OpenRouter。

截至6月底,总调用量已跻身全球前三

在Hermes、Claude Code、OpenClaw等Agent场景下,月调用量分列全球第一、第二和第三位。

全球开发者用实际调用行为给出了判断——LongCat-2.0已经进入“值得在生产环境使用”的区间。

社区反馈显示,在工具调用、复杂指令执行等Agent核心能力方面,LongCat-2.0-Preview接近Claude Opus 4.6。

最关键的一点:即将开源

美团宣布将于近期在多平台同步开源Infra框架、推理引擎、模型参数等核心技术。

这意味着开发者可以:

  • 研究万亿参数模型的训练框架
  • 在自己的场景中部署和微调
  • 基于国产算力构建自己的应用

从GLM-5.2到豆包2.1到LongCat-2.0,国产模型正在用三条不同的路径——开源、闭源API、国产算力全栈——同时证明一件事:

国产AI已经不只是“能用”了,是“能打”了。

💬 你会试LongCat-2.0吗?国产算力+万亿模型,你觉得能追上Claude吗?欢迎在评论区聊聊你的看法。

(本文基于美团LongCat-2.0发布会公开信息撰写。勇哥AI实验室,关注AI怎么用。)

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐