OpenAI 新模型 GPT-5.5-Cyber 发布，安全测试超越 Claude Mythos 5

小鹿软件办公

152人浏览 · 2026-06-24 19:38:45

小鹿软件办公 · 2026-06-24 19:38:45 发布

OpenAI 正进一步扩展其“Daybreak”网络安全计划，新增一款专为安全研究人员和防御者打造的专业AI模型。同时，Codex Security 也迎来了新功能升级，支持自动化的漏洞分析与修复。初步基准测试结果显示，该组合的表现已超越 Anthropic 的 Claude Mythos 5。

据 OpenAI 称，自今年 3 月发布以来，Codex Security 已分析了超过 3 万个代码库中的 3000 万次代码提交，并识别出 7 万个经人工审核确认已修复的问题。此外，还有超过 50 万份报告被系统自动判定为已解决。

GPT-5.5-Cyber

尽管各类 AI 工具在发现新漏洞方面已展现出强大的能力，但在漏洞评估、修复以及安全补丁的部署环节仍存在明显短板。OpenAI 此次旨在通过推出专为该领域定制的工具来解决这一问题，从而减轻安全团队的工作负担。

更新后的 AI 代理现在能够进行深度的代码分析、审查变更、追踪攻击路径、生成安全报告，并为后续的人工审查准备定制化的修复补丁。该工具还支持整合漏洞赏金报告、安全公告和工单系统等外部数据源，其分析结果可直接集成到现有的漏洞管理系统中。

OpenAI 表示，GPT-5.5-Cyber 将仅向经过验证的防御者开放。为此，公司正与美国人工智能标准与创新中心（CAISI）、国家网络总监办公室（ONCD）以及科学与技术政策办公室（OSTP）等美国政府机构保持密切合作。

初步测试结果令人瞩目

新系统的首批基准测试结果十分出色。在 OpenAI 自有的 CyberGym 基准测试中，GPT-5.5-Cyber 取得了 85.6% 的高分。作为对比，常规版 GPT-5.5 的得分为 81.8%，而 Anthropic 此前以 83.8% 的成绩领跑的 Claude Mythos 5，如今已被 OpenAI 重新超越。

GPT-5.5-Cyber

在 ExploitGym 测试中，差距更为显著：GPT-5.5-Cyber 得分达到 39.5%，而 GPT-5.5 仅为 25.95%。在 SEC-Bench Pro 测试中，该模型同样以 69.8% 的得分领先于得分 63.1% 的基础模型。

GPT-5.5-Cyber

在 Anthropic 凭借 Claude Mythos 5 惊艳 AI 行业之后，竞争对手们现已走出观望状态并大幅追赶。OpenAI 与 Anthropic 在网络安全这一新赛道上的直接竞争正日益激烈。

此外，OpenAI 通过 Daybreak 网络安全合作伙伴计划，向安全厂商和服务提供商开放了其技术。首批合作伙伴包括埃森哲（Accenture）、阿卡迈（Akamai）、思科（Cisco）、Cloudflare、CrowdStrike、IBM、Palo Alto Networks、Proofpoint、SentinelOne、Wiz 和 Zscaler 等。这些企业可通过“可信访问”模式，将 GPT-5.5-Cyber 集成到其产品和服务中。

与此同时，OpenAI 联合 Trail of Bits、HackerOne 和 Calif 等机构发起了“Patch the Planet”倡议，旨在利用 AI 辅助分析与人类安全专家的结合，进一步加固关键开源基础设施的安全性。

OpenAI 还扩大了与澳大利亚、加拿大、法国、德国、日本和韩国等多国政府及机构的合作。欧盟网络安全局（ENISA）等欧洲机构也加入了这一合作网络。其核心目标始终是更好地保护关键基础设施和国家网络免受网络攻击的威胁。

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

第14章可扩展性设计——插件、Skill与MCP

文章摘要 Claude Code 通过三层扩展架构实现高度可扩展性：插件系统实现条件加载，Skill 系统封装复杂工作流，MCP 协议集成外部服务。核心设计包括：1) 基于环境变量和功能标志的动态加载，利用死代码消除优化性能；2) 延迟加载函数解决循环依赖问题；3) 中心化工具注册表统一管理。这种模块化设计使得系统既能保持核心简洁，又能灵活扩展功能，类似乐高积木的组合方式，通过标准化接口实现无限可

AI编程社区

【VibeCoding系列教程18】IDE插件

AI编程社区

第15章状态管理与持久化——记忆的艺术

状态管理与持久化是构建有状态应用的核心挑战。Claude Code 通过精心设计的分层持久化策略、异步与同步的平衡、缓存与失效机制，以及容错与恢复机制，在无状态的 LLM 基础上构建出了一个仿佛有"记忆"的智能助手。这个设计不仅满足了当前的功能需求，也为未来的扩展留下了充足的空间。正如图书馆的价值不仅在于存储书籍，更在于如何组织、检索和更新它们一样，Claude Code 的真正力量也来自于其精心