当Boris Cherny说出"我已经八个月没手写过代码"时,他身后运行的不是某一个模型,而是一个由数千个AI智能体组成的自治编排系统。Claude Code正在经历一场从底层架构到交互范式的根本性变革。


一、事件背景:一条推文引爆的架构革命

Anthropic工程师Boris Cherny近日官宣:Claude Code下一版本将默认让子智能体(Sub-agents)在后台运行。这不是一个简单的功能更新,而是一次架构范式的根本性切换——Claude Code正在从一个"一问一答的对话框",进化为一个异步、并行、自治的工作流引擎

要理解这次变革的分量,需要回溯Claude Code在过去几个月中的三次关键架构迭代。这三次迭代的节奏之快、方向之明确,在AI开发工具领域几乎前所未见。

对于需要在生产环境中管理多模型API调用、统一接入不同大语言模型的团队而言,底层平台的架构选型至关重要。作为 微元算力(weytoken) 这样的企业级大模型聚合平台,我们持续跟踪这类架构演进,因为它直接决定了上层应用的编排能力和扩展天花板。


二、三步演进路线图:从定时任务到万级智能体并行

2.1 阶段一:Routines — 定时任务的基础设施化(4月)

核心变化:引入 cron/hooks 机制,任务调度跑在云端基础设施上。

Routines 的本质是将开发者从"实时在线驱动AI"的模式中解放出来。通过类 cron 的声明式配置,开发者可以定义:

  • 定时触发的代码审查任务(如每日凌晨扫描PR)
  • 事件驱动的自动化流水线(如 git push 触发自动重构)
  • 周期性健康检查与报告生成
# Routines 配置示例(概念性)
routines:
  - name: daily-code-review
    trigger: "cron:0 2 * * *"
    agent: claude-code
    task: "Review all open PRs in src/ directory"
    output: slack-channel(#code-reviews)

架构意义:这是Claude Code第一次具备了"脱离用户会话独立运行"的能力。虽然此时的任务模型还是单线程、串行的,但它奠定了云端调度层的基础。

2.2 阶段二:Dynamic Workflows — 多智能体并行编排(5月)

核心变化:ultracode模式下,可调度数十到上百个子智能体并行执行。

如果说Routines解决了"何时运行"的问题,Dynamic Workflows解决的则是"如何协同"的问题。这一阶段引入了:

能力维度 Routines(4月) Dynamic Workflows(5月)
执行模型 单任务串行 多智能体并行
调度粒度 固定cron/事件触发 动态DAG编排
智能体数量 1个 数十到上百个
状态管理 无状态 跨智能体状态共享
错误处理 重试/跳过 动态重分配/降级
适用场景 定时巡检、单点任务 大规模重构、并行分析

架构意义:Claude Code从"一个AI帮你干活"变成了"一个AI指挥一群AI干活"。主智能体(Orchestrator)负责任务分解与结果收束,子智能体(Workers)负责具体执行。这已经是一个典型的分布式智能体系统的雏形。

2.3 阶段三:后台子智能体默认运行(6月官宣)

核心变化:子智能体不再需要前台等待,默认在后台异步执行。

这是最新也是最关键的一步。在此之前,即使是并行模式,用户仍然需要在前台"看着"智能体运行。默认后台运行意味着:

  1. 主智能体完全解耦:用户发出指令后可以关闭终端,主智能体在云端持续编排
  2. 资源利用率最大化:不再受限于本地机器的算力和网络
  3. 真正的异步工作流:智能体完成后通过通知机制(Webhook/Slack/Email)回调用户
用户发出高层指令
       │
       ▼
┌─────────────────┐
│  主智能体(云端)   │ ← 用户可离线
│  任务分解 + 编排   │
└────────┬────────┘
         │ 动态分发
   ┌─────┼─────┐
   ▼     ▼     ▼
 [子智能体A] [子智能体B] [子智能体C]  ← 全部后台运行
   │     │     │
   └─────┼─────┘
         ▼
   结果收束 + 合并
         │
         ▼
   通知用户(Webhook/Slack)

三、架构深度拆解:子智能体编排系统的技术原理

从三次迭代的脉络来看,Claude Code正在构建的是一个分层智能体编排架构。我们可以将其拆解为四个核心层:

3.1 架构全景图

基础设施层

智能体执行层

编排调度层

用户交互层

高层意图描述

任务分解

动态调度

执行结果

执行结果

执行结果

状态同步

完成通知

用户终端/IDE

会话网关

主智能体 Orchestrator

任务队列 Task Queue

负载均衡器

子智能体 Worker-1

子智能体 Worker-2

子智能体 Worker-N

结果收集器

状态存储

云端沙箱环境

文件系统/Git仓库

3.2 各层职责详解

用户交互层(Interaction Layer)

  • 用户只需提供高层意图(如"重构整个auth模块"),不需要指定具体步骤
  • 会话网关负责将自然语言意图转化为结构化的任务描述
  • 关键设计:用户与编排系统完全解耦,提交后可离线

编排调度层(Orchestration Layer)

  • 主智能体是整个系统的大脑,负责:
    • 任务分解:将高层意图拆解为可并行执行的子任务DAG
    • 依赖分析:识别子任务间的前后依赖关系
    • 资源分配:根据子任务复杂度分配不同能力的子智能体
    • 异常处理:监控子智能体执行状态,处理超时、失败等异常
  • 任务队列采用优先级调度,支持动态插入和取消

智能体执行层(Execution Layer)

  • 每个子智能体运行在独立的云端沙箱中
  • 沙箱隔离确保并行任务之间不会互相干扰
  • 子智能体具备完整的工具链访问能力(文件读写、终端执行、网络请求)
  • 执行结果通过标准化的结果协议回传

基础设施层(Infrastructure Layer)

  • 状态存储维护全局任务状态、子任务进度、中间产物引用
  • 云端沙箱提供一致的文件系统视图
  • Git操作在沙箱层面进行隔离和合并

3.3 关键技术决策分析

为什么选择"默认后台"而非"可选后台"?

这个设计决策透露了Anthropic对AI编程工具未来的判断:

  1. 前台模式是反模式:让人类等待AI完成任务,本质上是在用人类的注意力资源补偿系统的同步阻塞,这是低效的
  2. 后台模式释放真正的并行能力:只有当用户不再"盯着"每个智能体时,系统才能真正扩展到数十、数百个并行智能体
  3. 信任模型的自治能力:默认后台意味着Anthropic对主智能体的编排可靠性有足够信心

四、“写提示的是另一个Claude” — 智能体自举的深层含义

Boris Cherny提到的另一个细节同样值得深挖:“写提示的是另一个Claude”

这意味着在Boris的工作流中,不仅执行代码的是AI,连给AI写指令的也是AI。这构成了一个智能体自举(Agent Bootstrapping) 的闭环:

生成任务提示

执行结果反馈

质量评估 + 调整策略

Claude-规划者

Claude-执行者集群

Claude-评估者

这个闭环的关键在于:人类的角色从"编写代码"上移到了"定义目标"。Boris八个月不手写代码,不是因为他不写代码了,而是他的工作已经完全转移到了更高层级的系统设计和目标定义上。

对于企业级大模型聚合平台而言,这种多智能体协同模式对底层API的稳定性、并发能力和模型路由策略提出了极高要求。无论是调度不同规格的模型来承担规划、执行、评估等不同角色,还是在高并发场景下保证任务队列的可靠运转,都需要平台层面提供坚实的基础设施支撑。


五、对开发工具生态的启示

Claude Code的这次架构演进,折射出AI开发工具正在经历的三个范式转移:

维度 旧范式 新范式
交互模式 同步对话(一问一答) 异步工作流(提交即走)
执行模型 单智能体串行 多智能体并行编排
人类角色 逐步指令驱动 高层意图定义
运行环境 本地终端 云端沙箱
扩展方式 插件/扩展 智能体数量水平扩展

这三个范式转移叠加在一起,指向一个清晰的趋势:AI编程工具正在从"辅助工具"进化为"自治工程团队"


六、总结

Claude Code的三次架构迭代——Routines、Dynamic Workflows、后台子智能体默认运行——不是三个独立功能的堆叠,而是一条清晰的架构演进路线:从对话框到工作流引擎,从单智能体到万级智能体编排,从同步阻塞到全异步自治

Boris Cherny"八个月不手写代码"的极端案例,或许正是未来软件工程的一个缩影。当AI不仅能写代码,还能自己分配任务、自己编排执行、自己评估质量时,人类工程师的核心价值将彻底转向架构设计与系统目标定义。


想了解企业级大模型聚合平台如何为多智能体架构提供稳定的底层支撑,了解更多技术细节,可以访问微元算力(weytoken)官网。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐