美团1.6万亿模型用国产芯片跑出来的，性能还超了GPT-5.5和Claude

Laboratory_yong

52人浏览 · 2026-06-30 15:25:50

Laboratory_yong · 2026-06-30 15:25:50 发布

AI圈又炸了一个重磅消息。

美团正式发布LongCat-2.0——1.6万亿参数，MoE架构，原生支持1M超长上下文，预训练数据超过30T tokens。

但最炸的不是参数，是训练方式。

LongCat-2.0是业界第一个在五万张国产算力卡上完成从预训练到推理全流程的万亿参数大模型。

全程跑在国产芯片上，从训练到推理，没有用一块英伟达A100或H100。

这意味着什么？

国产算力第一次真正扛住了万亿参数模型的训练压力。

五万张国产卡，跑通了万亿模型

LongCat团队从2023年开始啃国产算力这块硬骨头。

从千卡起步，逐步攻克算子适配、通信优化、分布式稳定性。三年的时间，终于把五万张国产卡集群跑通了。

几个关键突破：

通过HCCL异常处理、弹性扩缩卡和自动故障恢复，月均日故障率降低70%以上
通过流水线调度、显存优化和算子级控核，训练MFU提升1.5倍
稳态日吞吐超过1T tokens/day
全程未出现不可逆的loss尖刺与回滚

国产芯片虽然单卡性能不如英伟达最顶尖的产品，但计算正确性和精度已经足够满足需求，可以支撑万亿参数模型的稳定训练。

这不是实验室里的单次验证，是五万卡集群上的规模化生产。

性能：不只是“能用”，是“能打”

参数大不等于好用。但LongCat-2.0的性能数据确实能打。

在SWE-bench Pro（编程基准，考察深层工程能力）上：

LongCat-2.0：59.5分
GPT-5.5：58.6分
Claude Opus 4.6：57.3分
Gemini 3.1 Pro：54.2分

超过了GPT-5.5和Claude Opus 4.6。

在SWE-bench Multilingual上得分77.3，与Claude Opus 4.6的77.8几乎持平。

在Terminal-Bench 2.1上得分70.8，体现了在真实运维与开发终端任务中的稳定执行与纠错能力。

架构层面也有看点：

LSA稀疏注意力机制：处理长文本时计算量从平方级降至线性级
零计算专家机制：简单Token不消耗算力，复杂Token自动获得更多计算资源
MOPD架构：融合Agent、Reasoning、Interaction三组专家能力

全球开发者用脚投票

LongCat-2.0预览版此前以匿名方式接入了全球最大的大模型API路由平台OpenRouter。

截至6月底，总调用量已跻身全球前三。

在Hermes、Claude Code、OpenClaw等Agent场景下，月调用量分列全球第一、第二和第三位。

全球开发者用实际调用行为给出了判断——LongCat-2.0已经进入“值得在生产环境使用”的区间。

社区反馈显示，在工具调用、复杂指令执行等Agent核心能力方面，LongCat-2.0-Preview接近Claude Opus 4.6。

最关键的一点：即将开源

美团宣布将于近期在多平台同步开源Infra框架、推理引擎、模型参数等核心技术。

这意味着开发者可以：

研究万亿参数模型的训练框架
在自己的场景中部署和微调
基于国产算力构建自己的应用

从GLM-5.2到豆包2.1到LongCat-2.0，国产模型正在用三条不同的路径——开源、闭源API、国产算力全栈——同时证明一件事：

国产AI已经不只是“能用”了，是“能打”了。

💬 你会试LongCat-2.0吗？国产算力+万亿模型，你觉得能追上Claude吗？欢迎在评论区聊聊你的看法。

（本文基于美团LongCat-2.0发布会公开信息撰写。勇哥AI实验室，关注AI怎么用。）

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

Gemini 小企业工具怎么用：从客户沟通到内容整理

Gemini 面向小企业的新功能，核心价值不是替你“一键经营公司”，而是把零散业务任务整理成可执行的工作流。客户沟通、内容草稿、资料整理、计划拆解都可以交给 AI 做第一轮，但价格、承诺、隐私和最终判断必须留给人。对小企业来说，最好的 AI 用法不是追新功能，而是把每天重复的小任务变成稳定模板。

AI编程社区

2026年7月国内充值 GPT：为什么我不再建议只找低价渠道？

2026年6月，国内用户充值GPT（尤其是Plus/Pro/Codex）时，不再建议只寻找最低价渠道的核心原因在于：低价渠道的稳定性风险已远超其价格优势，可能带来更高的综合成本。

AI编程社区

2026年7月GPTPro/Codex 充值与额度管理指南：国内开发者如何稳定使用？

AI编程社区

所有评论(0)

查看更多评论

Laboratory_yong

@Laboratory_yong

已为社区贡献4条内容

美团1.6万亿模型用国产芯片跑出来的，性能还超了GPT-5.5和Claude

Laboratory_yong

五万张国产卡，跑通了万亿模型

性能：不只是“能用”，是“能打”

全球开发者用脚投票

最关键的一点：即将开源

所有评论(0)

温馨提示：您尚未绑定手机号

Laboratory_yong