LeCun 交棒后,Meta AI 重构底层路线,这次押在了分发系统上。

整理 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)

元宇宙那笔旧账还没彻底翻篇,Llama 帮 Meta 抢回来的那口气,也没能顺着 Llama 4 继续顶上去。就在这种有点尴尬、又有点着急的时刻,扎克伯格终于端出了他真正想要的东西。

不是一个只在排行榜上冒头的新模型名字,而是一层准备塞进 Meta 全家桶的默认智能接口。今早发布的 Muse Spark,就是这台新机器第一次公开开火的声音。

图片

过去一年,Meta 在 AI 上一直卡在一个很别扭的位置。它不是没有声量。Llama 一度让 Meta 重新站回开源 AI 的浪头,也让扎克伯格短暂摆脱了“只会烧钱搞元宇宙”的单线叙事。

可问题是,声量没有自然长成产品统治力。ChatGPT 改写了大众对 AI 入口的想象,Anthropic 拿走了高端用户心智,Google 又把模型、搜索、办公和系统入口重新焊回自己手里。Meta 明明握着最庞大的分发网络,却始终没把模型能力压成一个足够强势的产品形态。

更麻烦的是,Llama 4 也没把那种上升势头稳稳接住,原本的首席科学家、图灵奖得主杨立昆(Yann LeCun)也分道扬镳。围绕 benchmark 展示方式、能力预期和路线判断的争议,让 Meta 的模型叙事重新进入压力区。

扎克伯格显然不想再慢慢等了。他要的是把 AI 方向重新拎回自己手里,把研究、产品、分发重新捏成一台机器。Muse Spark,就是这次重组之后的第一张成绩单。

图片

Muse Spark 到底是什么?

Muse Spark 是 Meta Superintelligence Labs,也就是 MSL,拿出的首个模型。也就是说,来自于那位“赶跑杨立昆”的华裔小伙儿,Alexandr Wang。

图片

MSL 成立于 2025 年 6 月,Muse Spark 则是这支新团队在 9 个月重建 AI stack 之后交出的第一份公开答卷。Meta 给它的定位也不含糊:这不是一次常规升级,而是通向个人超级智能的第一步。

它现在已经进入 Meta AI app 和 meta.ai,接下来还会继续铺进 WhatsApp、Instagram、Facebook、Messenger 和 AI 眼镜。

它被定义成原生多模态推理模型,不是简单把文字和图像能力后拼在一起。Meta AI app 和 meta.ai 目前已经提供 Instant 与 Thinking 两种模式,而更重的 Contemplating 模式则把多个 specialized agents(专用智能体)并行拉进来,再把结果汇总,用来处理最难的问题。

这一下就把它和普通聊天模型拉开了。Muse Spark 不是靠单轮问答取胜,它更像一套分层工作的推理系统:快问题即时回,复杂问题深度想,最难的问题交给多 agent 并行处理。这套设计背后不是实验室里的概念炫技,而是很现实的产品取舍:既要能力,又要时延,又要能在消费级场景里大规模跑起来。

图片

Muse Spark 在 HealthBench Hard 上拿到 42.8,高于 GPT-5.4 的 40.1 和 Gemini 3.1 Pro 的 20.6;在 FrontierScience 上是 38.3%,也高于 GPT-5.4 的 36.7%。放到 Humanity’s Last Exam 这个公认最难的一类综合科研推理 benchmark 里,它在无工具条件下是 50.2%,而到了 Contemplating 模式,大约可以到 58%。

这层强化还延伸到了视觉和多模态。Muse Spark 在 CharXiv 上拿到 86.4,高于 GPT-5.4 的 82.8 和 Gemini 的 80.2;在 MMMU-Pro 上是 80.5%,虽然还略低于 Gemini 的 82.4%。再看 Meta 展示的那些场景,事情就更清楚了:识别货架商品,理解图表与现实环境,生成小网站和小游戏,结合帖子与社区内容回答问题。Muse Spark 不只是想证明自己会算题,它想直接住进 Meta 的产品里。

图片

扎克伯格放弃开源?

如果只把 Muse Spark 看成一次模型更新,就会把这件事看小了。

外媒盯住的也根本不只是模型本身。TechCrunch 直接把它写成 Meta AI 的一次彻底重做;Reuters 的标题更直接,说它是 Meta 这个高成本 superintelligence 团队推出的首个模型;CNBC 和 New York Times 也都把它放进同一条叙事线里:Meta 砸下巨大代价重组 AI 之后,终于拿出了第一项公开成果。

图片

Meta 这次重新构建了预训练堆栈,用比之前模型 Llama 4 Maverick 低超过一个数量级的计算量就能达到相同的能力。

真正的变化,在于它根本不是沿着 Llama 那条线自然长出来的续作,而更像 Meta 在组织、架构、分发和产品定义上重新开了一条路。当前版本是闭源,只向部分合作伙伴开放 private preview API,但 Meta 又故意留了一道口子:未来的 Muse 系列,可能同时存在闭源与开源变体。

它意味着 Meta 不是简单放弃开源,而是把开源从当前主叙事往后挪了一步。先把能力攥在手里,先把体验压进自家入口,再决定未来哪些层继续开放。这和 Llama 时代那种先用开放权重抢生态位置的打法,已经不是同一种节奏了。

如果只看总榜位置,Muse Spark 也已经进入前沿模型主桌。Artificial Analysis Intelligence Index v4.0 里,它的分数是 52,排在 第 4,落后于 Gemini 3.1 Pro 和 GPT-5.4 的 57,也略低于 Claude Opus 4.6 的 53。这还远远不够支持“Meta 已经反超”这种结论,但足以说明它已经不是空气产品。

所以,Muse Spark 的意义一半在产品层,另一半在组织层。它不仅是 MSL 的首个模型,也是 LeCun 离开之后,Meta 新 AI 权力结构第一次公开交卷。

图片

LeCun 离开后,谁在接管 Meta AI

LeCun 时代的 Meta AI,更像一家由研究者气质定义节奏的实验室。可以长期押注基础研究,可以通过开源建立声望,也可以不急着把一切都变成消费级产品。那是一种研究派主导的 Meta AI。

我们之前整理过一篇 LeCun 的采访,里面就聊到了当时的情况。

Muse Spark 所代表的新阶段,显然不再只是这套逻辑。MSL 的形成,本身就和 Meta 在 2025 年 6 月重组 AI 资源、引入 Alexandr Wang 进入新 AI 权力中心连在一起。和 LeCun 所代表的研究派相比,Wang 被拉进 Meta 的象征意义非常明确:扎克伯格要的不是更优雅的研究叙事,而是更高执行力、更强产品化、更贴近平台战争的 AI 组织。

曾经 Llama 其实是 Meta 在 AI 上最关键的一次翻盘。它赢得了开发者声量,也赢得了开源叙事,甚至一度让 Meta 成为 OpenAI 之外另一种未来的代表公司之一。没有这段历史,Muse Spark 的分量会被误读。

问题在于,Llama 的成功主要发生在模型层和生态层,但 Meta 真正最擅长的地方,从来不是只做一个模型,而是把能力压进巨大的分发系统。也正因为这样,当 Llama 4 没能把那种高度确定的胜势继续往前推时,Meta 才会显得格外别扭:它明明拥有最庞大的入口,却没有把入口变成 AI 时代的决定性优势。

Muse Spark 在补的,正是这门课。它和 Llama 时代最不一样的地方,不在于某个单点 benchmark,而在于 Meta 终于开始把“我有模型能力”改写成“我能把模型能力装进日常入口”。从这个角度看,Muse Spark 的关键词不是参数,不是排行榜,而是分发。

而一旦谈到分发,Meta 就回到了自己最擅长的战场。

图片

图片

Meta 重新回到主桌,但还没赢

OpenAI 拥有产品速度,Anthropic 拥有高质量心智,Google 拥有基础设施和系统入口,但 Meta 拥有的是社交网络、内容流、消息系统和可穿戴设备的组合。这也是为什么 Meta 在发布 Muse Spark 时,反复强调它后续将进入 WhatsApp、Instagram、Facebook、Messenger 和 AI 眼镜。它不是想再做一个独立 AI app,而是想让 AI 成为整个产品矩阵的默认接口。

这种思路,也能从它的发布姿态里看出来。Muse Spark 首发没有沿用 Llama 那套开放权重叙事,而是先进入 Meta 自家的 app 和网页,并只向部分合作伙伴开放 private preview API。官方当然还留着“未来继续推出更先进开源模型”的空间,但至少在 Muse Spark 这一代上,Meta 的优先级已经很清楚了:先把能力攥在自己手里,先把体验做进自家分发系统,先让这台新机器跑起来。

图片

更关键的是,这条路线不是只追求更强,而是在追求更有效率。Muse Spark 在 Intelligence Index 评测中只用了 58M tokens,而 GPT-5.4 用了 120M,Claude Opus 用了 157M。换句话说,在接近前沿模型主桌的能力下,Muse Spark 打出了大约 2 到 3 倍的 token 效率。thinking time penalty、token compression、强化学习后训练优化,这些训练方法关键词最后都指向同一件事:Meta 想要的不只是更大的模型,而是一个能在消费级产品里大规模跑起来的推理系统。

这其实是一种很 Meta 的回归。元宇宙时代留下的最大后遗症,不只是亏了多少钱,而是扎克伯格必须重新证明,Meta 仍然配得上“下一代平台公司”这个位置。Llama 曾经帮他短暂拿回这个叙事,但那更多是研究层和生态层的胜利;Muse Spark 则更像是一次平台层和组织层的重新排兵布阵。它意味着 Meta 不再满足于做 AI 时代的基础设施参与者,而是想重新争取入口、分发和用户关系的定义权。

Muse Spark 让 Meta 终于重新拿出了一套能同时讲通模型、产品、组织和平台的 AI 叙事,但又没有强到可以让所有问题都消失。真正的问题不再是“Meta 有没有筹码”,而是当扎克伯格亲自收拢方向、Wang 接手执行后,Meta 能不能把这套集中在 health、science 和多模态推理上的能力,真正压进它那台庞大的分发机器里。

这场仗现在还远没打完。

但 Meta 至少已经重新回到主桌中央了。

(投稿或寻求报道:zhanghy@csdn.net)

Muse Spark 目前可在 meta.ai 和 Meta AI 应用中获取。

推荐阅读:

当 AI 主宰写代码,MoonBit 嵌入「形式化验证」让 Bug 清零

华人辍学博士揪出Claude Code 51万行源码泄露,官方请求下架超8000个GitHub代码库并回应:这次是人为失误,无人被解雇!

套壳自家Edge?Win11新版Copilot遭网友深扒:微软让我们用不同的名字下载了7次IE

【活动分享】"48 小时,与 50+ 位大厂技术决策者,共探 AI 落地真路径。"

由 CSDN&奇点智能研究院联合举办的「全球机器学习技术大会」正式升级为「奇点智能技术大会」。

2026 奇点智能技术大会将于 4 月 17-18 日在上海环球港凯悦酒店正式召开,大会聚焦大模型技术演进、智能体系统工程、OpenClaw 生态实践及 AI 行业落地等十二大专题板块,特邀来自BAT、京东、微软、小红书、美团等头部企业的 50+ 位技术决策者分享实战案例。旨在帮助技术管理者与一线 AI 落地人员规避选型风险、降低试错成本、获取可复用的工程方法论,真正实现 AI 技术的规模化落地与商业价值转化。

这不仅是一场技术的盛宴,更是决策者把握 2026 AI 拐点的战略机会。

图片

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐