Anthropic 放出最强模型但不让你用:Claude Mythos 和它发现的数千个零日漏洞
点击上方 前端Q,关注公众号
回复加群,加入前端Q技术交流群
4 月 7 日,Anthropic 联合 Apple、Google、Microsoft 等 12 家巨头发布了 Claude Mythos Preview——目前地球上编程和安全能力最强的 AI 模型。但你用不了。
说实话,我追 AI 新闻这么久,很少有哪个发布让我觉得"世界线真的变了"。但这次 Anthropic 搞的 Project Glasswing,我看完官方页面之后愣了好一会儿。
不是因为又刷榜了——虽然确实刷了,而且刷得很恐怖。而是因为 Anthropic 做了一个我没想到的决定:这个模型太强了,所以我们不公开发布。
先说发生了什么
4 月 7 日,Anthropic 宣布了一个叫 Project Glasswing(名字来自一种透明翅膀的蝴蝶)的网络安全倡议。12 个创始伙伴包括:
AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks
对,你没看错,苹果和谷歌和微软同时出现在一个项目的合作名单里。这事本身就够罕见了。
这个项目的核心,是 Anthropic 训出来的一个新模型——Claude Mythos Preview。Anthropic 自己的定义是:"一个通用前沿模型,揭示了一个残酷事实:AI 模型在发现和利用软件漏洞方面的能力,已经超越了除最顶尖的人类安全专家之外的所有人。"
Mythos 到底有多强
先看硬数据。对比 Claude Opus 4.6(目前公众能用到的最强 Claude 模型):
| 基准测试 | Mythos Preview | Opus 4.6 | 差距 |
|---|---|---|---|
| SWE-bench Verified | 93.9% | 80.8% | +13.1 |
| SWE-bench Pro | 77.8% | 53.4% | +24.4 |
| Terminal-Bench 2.0 | 82.0% | 65.4% | +16.6 |
| CyberGym(漏洞复现) | 83.1% | 66.6% | +16.5 |
| GPQA Diamond | 94.6% | 91.3% | +3.3 |
| Humanity's Last Exam(带工具) | 64.7% | 53.1% | +11.6 |
SWE-bench Pro 直接从 53.4% 跳到 77.8%,这不是进步,这是代差。
但真正让人头皮发麻的不是跑分,而是它实际干的事。
▎三个真实案例
案例一:OpenBSD 里藏了 27 年的漏洞
OpenBSD 被公认为世界上安全性最高的操作系统之一,大量防火墙和关键基础设施在跑它。Mythos 发现了一个存在 27 年的远程漏洞——攻击者只需要连接到目标机器,就能让它崩溃。27 年。无数安全专家审计过这个代码。
案例二:FFmpeg 里 16 年的漏洞,自动化工具扫了 500 万次没抓到
FFmpeg 是视频编解码的基础库,几乎所有视频处理软件都在用它。Mythos 找到了一个存在 16 年的漏洞,而自动化测试工具在这行代码上跑了 500 万次——没抓到过一次。
案例三:Linux 内核提权漏洞链
Mythos 自主发现了 Linux 内核中多个漏洞,并把它们串成了一条完整的攻击链:从普通用户权限直接提升到 root 控制整台机器。关键是,整个过程完全自主完成,没有人类引导。
Anthropic 官方的原话是:"过去几周内,Mythos Preview 已经在每一个主流操作系统和每一个主流浏览器中找到了数千个高危零日漏洞。"
你想想,你每天写的前端代码跑在的那些浏览器——Chrome、Firefox、Safari、Edge——它们都被 Mythos 找出了高危漏洞。
为什么不给你用
这可能是整件事里最有意思的部分。
Anthropic 明确说了:"我们不计划让 Claude Mythos Preview 公开可用。"
原因很直接:这个模型的攻击能力和防御能力是对称的。它能帮好人找漏洞修漏洞,也能帮坏人找漏洞攻系统。而且它太强了,一旦放出去,攻防平衡会被彻底打破。
CrowdStrike 的 CTO Elia Zaitsev 说得很直白:
"从漏洞被发现到被攻击者利用的窗口期已经崩塌了——过去需要几个月,现在有了 AI 只需要几分钟。"
所以 Anthropic 选了一条不一样的路:不卖给你,而是拉上 12 家巨头一起用这个模型来主动修补全世界最关键的基础设施。
▎钱和资源
▸Anthropic 承诺 1 亿美元的 Mythos Preview 计算额度给合作伙伴
▸向 Linux 基金会捐赠 250 万美元
▸向 Apache 软件基金会捐赠 150 万美元
▸核心合作伙伴 12 家 + 额外 40 多家关键基础设施维护组织也能用
后续如果需要付费使用,定价是 每百万输入 token $25,每百万输出 token $125。对比 Claude Opus 4.6 的 $15/$75,贵了将近一倍。
这事跟你有什么关系
你可能会想:这是安全圈的事,跟我写前端有什么关系?
关系很大。
第一,你写的代码跑在有漏洞的平台上。 Mythos 在每个主流浏览器里都找到了高危漏洞。Chrome 的 V8 引擎、Firefox 的渲染引擎、Safari 的 WebKit——这些就是你每天写的 JavaScript 和 CSS 运行的地方。这些漏洞被修之前,你的用户就是暴露的。
第二,AI 编程工具的能力天花板又上了一层。 SWE-bench Verified 93.9%,意味着这个模型能自主解决绝大多数真实世界的软件工程问题。虽然 Mythos 不公开,但 Anthropic 说了,它最终的目标是把"Mythos 级别的能力"带到后续的 Claude Opus 模型里,搭配安全护栏后公开发布。
第三,安全正在变成所有开发者的必修课。 当 AI 能在几分钟内找到并利用你代码里的漏洞时,"先上线后修 bug"的思路就行不通了。Linux 基金会 CEO Jim Zemlin 在评论里说的一句话我觉得很有洞察:
"开源维护者——他们的软件支撑着全世界的关键基础设施——一直以来只能自己搞安全。Project Glasswing 提供了一条可信的路径:让 AI 驱动的安全成为每个维护者的可靠帮手,而不只是给买得起昂贵安全团队的大公司用。"
本周其他值得关注的事
Claude Mythos 是本周的头条,但还有几件事值得一提:
DeepSeek V4 上线"专家模式"(4 月 8 日): DeepSeek 在网页端推出了快速模式、专家模式和视觉模式三档。专家模式支持 100 万 token 上下文、推理能力进入国内第一梯队,灰度期免费。V4 正式全量应该不远了。
智谱 GLM-5.1 发布(4 月 8 日): 754B 参数的开源模型,最大看点是能自主工作 8 小时。SWE-bench Pro 得分在开源模型里排第一、国产模型第一、全球第三。智谱还首次提价 10%,编码定价追平 Anthropic——国产大模型开始从价格战转向性能溢价了。
Meta Muse Spark 发布(4 月 8 日): Meta 143 亿美元投资组建超级智能团队后的第一个模型,支持多模态、复杂推理,已上线 Meta AI 应用,后续会推到 WhatsApp、Instagram、Facebook 等全平台。
聊聊我的看法
说实话,我盯着 Anthropic 那个官方页面看了很久。
Claude Mythos 这件事,我觉得真正的信号不是"又有了一个更强的模型"。真正的信号是:AI 模型的能力已经强到,负责任的做法是选择不发布。
这在 AI 历史上还是第一次。以前所有公司都是生怕发得不够快——GPT-4 出来 Anthropic 赶紧发 Claude 3,Claude 3 出来 Google 赶紧发 Gemini。现在 Anthropic 说:我们有个比所有模型都强得多的东西,但我们不卖。
这不是营销手段。你看看那个合作名单——苹果、微软、谷歌、英伟达、CrowdStrike——这些公司不会为了配合一个营销噱头站台。它们是因为真的看到了 Mythos 的能力,然后觉得必须参与进来。
对我们普通开发者来说,短期内最实际的影响是:后续的 Claude Opus 模型会带着 Mythos 级别的能力 + 安全护栏公开发布。 Anthropic 已经明确说了这是计划。到时候我们手里的 AI 编程工具又会有一次质的飞跃。
但更长远来看,我觉得这件事改变了一个默认假设:不是所有技术进步都应该无条件开放。在 AI 安全这个领域,"有能力做到"和"应该让所有人都能做到"之间,开始出现了真实的裂缝。
这个裂缝以后会越来越大。而我们每个写代码的人,都在这个裂缝的一边。

往期推荐
Multi-Agent Teams:让多个专家 Agent 像团队一样协作

AI Agent 是怎么"想一步做一步"的?拆解 ReAct 模式

从零开始:用 LangChain.js 构建你的第一个 Tool-Calling Agent

最后


点个在看支持我吧

更多推荐





所有评论(0)