Cursor发布Composer 2.5

青柠派

631人浏览 · 2026-05-19 16:58:37

青柠派 · 2026-05-19 16:58:37 发布

今天AI行业的动态密集得有些不寻常：Anthropic在伦敦活动现场连发四项Claude相关更新，涵盖算力扩容、编程工具提速、企业级隔离方案和开发者诊断工具；Cursor在Google I/O开幕前夜宣布新模型Composer 2.5上线，并披露了与SpaceX合作从头训练更大模型的计划；Anthropic同时宣布收购SDK平台Stainless API；Google I/O 2026将于北京时间5月20日凌晨1点正式开幕。今天发生的这些事，大多数对做内容或用AI工作的人都有直接影响，值得逐条看清楚。

一、Claude Design算力翻番，全套餐token上限扩大两倍

Claude（Anthropic旗下AI产品）今天宣布，Claude Design所有套餐的token（处理文字和图像的基本单位，可以简单理解为"计算额度"）上限翻倍，Pro版、Team版都在内。此前不少用户在做批量图像生成、视觉创意任务时会频繁触到上限，这次扩容直接把可用量翻了一倍，价格不变。这条公告在X上点赞超过1.5万，是近期Claude公告中互动最高的一条。

这次扩容的实际意义在于：之前很多用户在Claude Design里跑到一半就被卡住，要么等明天重置，要么升更贵的套餐。现在上限翻倍，中等体量的图像任务可以在单次对话中完成，不用跨会话重新铺上下文。对做设计、做封面图、做品牌视觉的内容创作者来说，这是真实的效率提升。

实用建议：第一，今天就去Claude Design重新测试之前因"额度不足"放弃的大批量图像任务，看现在能跑多远；第二，封面图、插图、分镜草图这类多图需求现在可以在单次对话里做完，减少重复开对话的麻烦；第三，「Claude Design翻倍之后，我用它做了一套完整品牌视觉」这类实测内容，现在是发布窗口。

需要注意的是，翻倍的是token上限而非响应速率，如果你的任务量极大，仍可能遇到排队；标题别写"Claude Design现在无限生成了"，那不准确。

二、Claude Code快速模式切底座，默认改用Opus 4.7，响应速度提升约2.5倍

Claude Code（面向程序员的AI编程工具）的"/fast"快速模式底层模型升级为Opus 4.7，官方公布的速度数据是约2.5倍于标准模式，但对应的单次token费用也更贵。Anthropic的定位是：快速模式适合"快速迭代、实时调试、时间敏感"的场景，不适合所有任务都开。公告点赞近5000。

对开发者和内容创作者来说，这个变化的关键是：以前快速模式是可选项，现在它的底层模型变强了，"快"和"准"的权衡点发生了移动。Opus 4.7在理解复杂指令方面比上一版更稳，这意味着在真正需要快速迭代的场合，不用再担心"速度快但答案歪"的情况。

实用建议：第一，在Claude Code里输入"/fast"切换到快速模式，短任务、找bug、语法检查这些场景用它；第二，长文档生成、大规模重构等任务不需要开快速模式，标准模式节省成本；第三，「Claude Code快速模式实测：速度快多少、贵多少」是一条可以量化对比的内容选题，数据来源直接截Claude Console账单。

需要注意的是，Opus 4.7不是全新的大版本迭代，它的提升主要体现在响应延迟和指令跟随，不要把这条做成"Claude发布全新旗舰模型"的选题。

三、Claude推企业级自托管沙箱和MCP隧道，Agent终于能跑在公司自己的网络里

Anthropic在伦敦举办的Code with Claude活动上，宣布两项企业功能：一是自托管沙箱（self-hosted sandboxes）进入公开测试，企业可以把Agent（能自主完成任务的AI助手）的运行环境部署在自己的服务器上，不走Anthropic的云端；二是MCP隧道（MCP tunnels）进入研究预览阶段，Agent可以通过加密隧道访问公司内网里的MCP服务器，不需要把内网服务暴露到公网。

这两项功能解决的是同一类问题：企业在用AI Agent的时候，数据安全和网络隔离是头号顾虑。以前Claude的Agent方案只能走Anthropic托管的云端，内网系统要接进来就必须开公网端口，这在有合规要求的行业（金融、医疗、政府）几乎是不可能的。现在自托管沙箱让"计算在公司内部"成为可能，MCP隧道让"内网服务接入"不再需要开端口。

实用建议：第一，企业技术负责人可以在Claude Platform提交自托管沙箱申请，MCP隧道需要单独申请研究预览权限；第二，「Claude企业版进化：你的AI Agent现在可以完全跑在公司防火墙里」是面向技术决策者的内容选题，这类读者愿意付费看深度内容；第三，如果公司内部MCP服务一直因为网络问题接不进Claude，可以优先排期评估MCP隧道方案。

需要注意的是，自托管沙箱目前是公开测试阶段，SLA（服务可用性承诺）和功能覆盖尚不完整，生产环境部署前需要做充分测试，不能直接拿来用于关键业务。

四、Claude Console新增缓存诊断工具，能看到哪段改动让缓存失效了

Anthropic为Claude Console（开发者控制台）新增了prompt cache diagnostics（提示词缓存诊断）功能。缓存是指：当开发者连续发送相似请求时，系统可以把没变的部分存起来复用，省掉重复计算的成本。一旦请求中有部分发生了变化，缓存就"失效"，就需要重新付费计算整段内容。以前开发者不知道是哪部分变了，只能靠猜。现在这个诊断工具直接显示：哪段prompt变了、因此多花了多少token。

对开发者来说，这个工具的价值在于把优化从"靠感觉"变成"可测量"。一些常见的缓存失效原因包括：把时间戳或随机ID混进了system prompt（系统提示词）、把动态用户数据写进了本来应该静态的部分、每次请求的格式有细微差异。诊断工具能快速定位这些问题，修掉之后缓存命中率可以显著提升，在高并发接口上省下来的成本是实打实的。

实用建议：第一，在Claude Console的platform.claude.com/usage/cache页面查看缓存诊断数据，找出高频接口里哪些变动是多余的；第二，把可以复用的内容（比如产品说明、角色设定）提取到静态的system prompt里，动态内容只放在user turn；第三，「怎么把Claude API的缓存命中率从30%提升到80%」是一条对开发者很有用的教程选题，数据可以用自己的Console截图做素材。

需要注意的是，诊断工具只显示"哪里变了"，不会自动建议你怎么改，判断哪些变动可以去掉需要开发者自己来——工具是放大镜，不是自动修复器。

五、Anthropic收购Stainless API，把SDK和MCP服务器生成平台并入自家

Anthropic宣布收购Stainless API，一家SDK（软件开发工具包）和MCP服务器自动生成平台。Stainless在Anthropic还是早期API阶段就为其提供SDK基础设施，也就是说开发者现在用的那些Python、TypeScript版的Claude SDK，背后很长一段时间都是Stainless在维护。收购后，Stainless团队并入Anthropic，服务继续运营。公告点赞2500、转发332。

从战略角度看，这笔收购的逻辑是：MCP（模型上下文协议，让AI和外部工具互联的协议）正在成为Anthropic生态的核心基础设施，Stainless恰好做的是"自动生成MCP服务器"这件事。把它并进来，相当于把MCP生态的一个关键工具链收归自己控制，避免对外部服务商产生依赖。

实用建议：第一，「Anthropic为什么要买SDK生成公司？」从MCP生态建设角度解读这笔收购，这种产业逻辑分析内容在知乎有稳定阅读量；第二，如果你的团队正在用Stainless生成MCP服务器或SDK wrapper，短期不需要做切换，关注官方后续整合公告；第三，可以用这条新闻作为切入点，做一期"AI公司在抢购哪类基础设施"的深度内容，Stainless只是其中一个案例。

需要注意的是，收购不等于产品立即合并，短期内Stainless独立服务正常运营，不需要担心接口突然失效。

六、Cursor发布Composer 2.5，并宣布和SpaceX合作训练10倍规模新模型

Cursor（AI编程工具）今天宣布Composer 2.5正式上线，定位是迄今为止最强的编程模型，在长任务持续性（处理跨多个文件、长时间运行任务的能力）和复杂指令跟随方面有明显提升，未来一周内对所有用户的使用量翻倍赠送。该公告点赞超过1万，是今天所有AI工具发布中互动量最高的一条。

同时，Cursor披露了一个更长远的计划：与SpaceX AI合作，使用Colossus 2的算力集群（拥有百万张相当于H100级别的GPU），从零训练规模比当前大10倍的下一代模型。训练数据和技术方案结合了两家公司各自积累。

对内容创作者来说，Composer 2.5的上线代表了一次可量化测评的机会。"长任务持续性"的改进适合用于多文件重构、跨模块功能开发这类场景。本周Cursor和Claude Code都密集发布，横向对比内容的需求正处于高点。

实用建议：第一，Cursor用户在Composer面板切换到2.5版本，未来一周使用量翻倍，是试用成本最低的窗口；第二，「Cursor vs Claude Code 2025年横评：谁更值得买」这个选题现在做正好，两家都在这周放更新；第三，「Cursor要自己训练模型了，意味着什么」是一条可以做深度分析的选题，角度可以是"编程工具公司的护城河究竟在哪里"。

需要注意的是，Cursor与SpaceX合作训练的大模型是中长期计划，Composer 2.5本身还是基于现有第三方基础模型微调的，不要把这两件事混在一起，发稿时间线要说清楚。

七、Google I/O 2026今晚开幕，Search、Gemini、Antigravity五条产品线全线预告

Google一年一度的I/O开发者大会北京时间5月20日凌晨1点开播，Sundar Pichai（Google CEO）已带队抵达会场，官方账号同步预热：本届I/O涵盖Search（搜索）、Gemini应用、Antigravity（Google新推出的Agent平台，名字还比较陌生）、Google AI Studio、Google DeepMind五条产品线。Pichai预热帖点赞超8000、转发724，是今天X上互动量最高的AI相关帖。

今年I/O的看点和往年有所不同：此前Google多次在I/O上宣布了"即将上线"的功能，实际落地往往要等三到六个月。今年的预告措辞更强调"全线产品更新"而非单点技术发布，意味着内容密度可能更高，但每条更新的可落地程度需要逐一确认。Antigravity是一条陌生的新产品线，名字本身就意味着解读空间，率先做深度分析的内容会有先发优势。

实用建议：第一，直播在YouTube和io.google，北京时间凌晨1点开始，建议开双屏，一个跟Keynote，一个翻X看真实开发者反应，两种视角都有素材；第二，发布会结束后，「I/O五分钟看完」快速版和「Antigravity是什么，为什么重要」深度版，是两条发布节奏清晰的内容；第三，Google官方素材是公开授权的，截图、剪辑、二创不需要担心版权。

需要注意的是，Google在I/O上的演示版功能不等于当天上线，历届都有项目是只限Waitlist、只限Pixel设备或只限付费用户，标题先写"官宣/预览"，等确认开放范围再做"现已上线"的推送。

总结

今天的动态集中在一个信号上：AI工具正在从"单次对话"走向"持续任务+系统集成"的形态。Claude的自托管沙箱和MCP隧道，解决的是企业级系统集成的安全顾虑；Cursor的长任务持续性改进，解决的是AI编程工具在真实工程项目中的稳定性；Claude Design的token翻倍，解决的是内容创作场景里的容量瓶颈。对自媒体来说，今晚Google I/O是近期最大的一个流量窗口，提前做好选题布局。