就在昨天(2026年5月28日),刚刚登顶全球最高估值AI创企的 Anthropic 再次放出了大招——正式发布了其最新旗舰模型 Claude Opus 4.8

在 GPT-5.5 和 Gemini 3.1 Pro 的步步紧逼下,这次的 Opus 4.8 不仅没有“挤牙膏”,反而在代码编写、Agent(智能体)执行、复杂推理上实现了质的飞跃。更狠的是,能力大幅增强的同时,API 价格依然维持不变!

废话不多说,我们直接来看看这次 Opus 4.8 到底带来了哪些硬核升级。
在这里插入图片描述


1. 霸榜跑分:专为 Agent 与复杂代码而生

如果你之前觉得大模型写代码、跑任务总是“差那么点意思”,Opus 4.8 可能会彻底改变你的工作流。根据 Anthropic 公布的实测数据,Opus 4.8 简直是专为自动化 Agent 量身定制的:

  • Agentic 代码能力 (SWE-Bench Pro):得分从上一代的 64.3% 飙升至 69.2%,在解决真实世界软件工程问题上,直接超越了 GPT-5.5 和 Gemini 3.1 Pro。
  • 跨学科复杂推理:胜率提升至 57.9%,外部工具调用的稳定性大幅增强。
  • Agent 电脑操作 (OSWorld):达到了惊人的 83.4%,是目前测试中表现最强大的“电脑操作与浏览器智能体”模型。

在这里插入图片描述


2. 引入“动态工作流”:一个人就是一支开发团队

这可能是对开发者最震撼的新特性。

依托于其自家的 Claude Code 平台,Opus 4.8 引入了动态工作流 (Dynamic Workflows) 功能(目前为研究预览版)。这意味着什么?

当面对一个庞大的编程任务(比如跨越几十万行代码的底层重构或迁移),Opus 4.8 不再是单线程死磕,而是能够同时规划并运行数百个并行的 AI “子智能体 (Subagents)”。它能自己拆解任务、分发处理、最后汇总。这不仅极大提升了大型项目重构的效率,更是真正触及了“自主软件工程”的门槛。在这里插入图片描述


3. “防忽悠”机制:诚实度与代码自查能力史诗级提升

我们都吃过大模型“一本正经胡说八道”或者“盲目自信”的亏。Anthropic 这次重点针对“幻觉”进行了对齐训练。

早期测试的架构师们反馈,Opus 4.8 的技术判断力变得极其敏锐:

  • 主动质疑与拒绝: 遇到不靠谱的架构计划,它会直接提出质疑;在执行多服务复杂操作前,它会主动要求建立充分的测试用例来验证,而不是直接莽上去修改代码。
  • 代码查错: 官方评测显示,Opus 4.8 放过自己所写代码中 Bug 的概率,比 4.7 版本整整降低了 4 倍!它变得更严谨、更具反思性。在这里插入图片描述

4. 丰俭由人:全新的“精力控制”与极速模式

在成本和资源耗费的控制上,Anthropic 这次把微调的权限交给了用户。

  • 精力控制 (Effort Controls): 用户现在可以在 Claude.ai 和相关工作流中,手动调节 AI 的“投入精力”。在【高档位】(默认),它会触发自适应深度思考,给出更完美的解答;在【低档位】,它则会极速响应,帮你省下大量的 Rate Limit(速率限制)额度。
  • 极速模式 (Fast Mode): 对于低延迟任务,Opus 4.8 提供了一个狂飙 2.5 倍速度的选项,而且该模式下的运行成本比之前便宜了 3 倍。

*(排版建议:此处可配一张 Claude.ai 界面中“Effort Control”的设置界面截图或动图,展示高低档位的切换)*


5. 极致的开发体验:百万上下文与动态系统提示词

作为开发者,API 层面还有几个不容错过的爽点:

  • 默认 100 万 Token 上下文 + 12.8 万超大输出:处理几十个长篇文档或巨型代码库毫无压力。
  • 会话中途修改系统指令 (Mid-conversation system messages): 这绝对是一项神仙功能!在漫长的 Agent 会话中,如果你需要中途改变 System Prompt 的规则,现在可以直接在非首位的位置发送。这样不仅不用重新开局,还能完美保留之前的 Prompt Cache(提示词缓存),省钱又高效。

目前,GitHub Copilot 已经光速接入了 Opus 4.8。对于 Copilot Pro+ 和企业版用户,今天就可以直接在 IDE 里上手体验了。


写在最后:风暴前夕的 Mythos?

值得注意的是,在发布 Opus 4.8 的同时,Anthropic 官方还在公告中悄悄埋下了一个重磅彩蛋:他们即将在未来几周内,向公众逐步开放更高级别、主打极致安全与性能的 Mythos 级模型(此前代号 Project Glasswing,一直仅限少数头部企业内测)。

2026年年中的大模型之战,正随着算力的爆发进入最高潮。Opus 4.8 的表现已经如此能打,Mythos 又会带来怎样的降维打击?让我们拭目以待!
在这里插入图片描述

参考文献

[1] Anthropic. Introducing Claude Opus 4.8. https://www.anthropic.com/news/claude-opus-4-8
[2] Claude API Docs. What’s new in Claude Opus 4.8. https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-8

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐