AI造AI时代已至:Claude代码占比超80%,Anthropic呼吁必要时暂停研发

AI正在以前所未有的速度自我进化。Anthropic最新发布的报告《当AI开始造AI》揭示,其代码库中超过80%的代码由Claude编写,工程师人均代码产出较2024年暴增8倍,许多研究员已连续5个月未手写一行代码。

在工程层面,Claude的表现令人震惊。在最开放的工程任务上,其成功率在半年内从26%飙升至76%。一次系统升级导致数万训练任务崩溃,Claude仅用两小时就完成排查与修复,而人工通常需要两三天。2026年4月的一次“大扫除”,Claude提交了800多个修复,将一类API错误降低了1000倍,工作量相当于人类工程师4年。

研究层面的进步更为惊人。在优化训练代码的测试中,Claude Mythos Preview实现了52倍加速,而熟练的人类研究员需要4-8小时才能达到4倍加速。这意味着,在目标明确的实验优化环节,AI的效率已超越人类一个数量级。

更关键的是,Claude开始展现出“研究判断力”。在复盘人类研究员“走弯路”的实验中,2026年4月的Mythos Preview有64%的概率能给出比人类更优的下一步决策。在端到端的AI安全实验中,Claude智能体军团用800小时追回了97%的性能差距,而人类研究员一周仅追回23%。

Anthropic指出,人类目前仅存的优势是“研究品味”——判断哪些问题值得探索。但历史表明,这种能力很可能只是AI“暂时不会,然后突然就会了”的又一项技能。

面对加速逼近的“递归自我改进”(RSI)奇点,Anthropic发出了严肃警告:必要时,全球应共同按下前沿AI研发的“暂停键”。他们强调,这需要多国、多个前沿实验室在同等条件下同步暂停,且过程可验证,以避免谨慎者将领先优势拱手让给最不谨慎的竞争者。

从80%的代码产出到52倍的实验加速,AI自我进化的飞轮已开始转动。一旦“研究品味”这最后一道关卡被攻克,AI研发的速度将完全由算力决定,从AGI到ASI的距离可能短到以“模型代际”计量。这不仅将重塑AI领域,更将彻底改变药物研发、材料科学、能源和机器人等每一个关键行业。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐