进入智能体时代后,token的消耗成为不可承受之痛,针对这一问题,我们开展了一系列研究。

Codex的desktop app随着更新越来越频繁,功能相比同类agent提升了非常多,目前更是在windows和mac上都提供了computer use功能,让完全操作电脑成为可能。不过最近大家普遍都反馈codex的coding plan越来越不耐用了。无论是plus、business,还是pro 5x 都很不耐用。如果给他一个开发任务让他跑,开/goal模式,半个小时就能用完五小时额度,跑一天,周额度就见底了。 

图片

能不能把国产的廉价token用到codex里,这样既能享受openai codex的harness能力又能用国产的便宜token呢? 

图片

今天给大家分享的就是我们自主研发的开源工具“ CCSwitchMulti ” 。你可以通过它,在codex的官方Desktop app中实现openai官方模型(如GPT-5.5)与第三方模型(如DeepSeekV4-Flash、GLM5.2 或者本地部署的Qwen3.6 27B)混合使用。让codex可以根据任务类型,选择合适的国产模型执行任务。通过多智能体互联,以实现节省主agent上下文开销,降低codex额度用量的效果。该项目基于开源项目ccswitch改进。为其加上了多路路由、openai订阅转出apikey、历史记录修复等功能。

https://github.com/BigStrongSun/ccswitchmulti

图片

图片

配上本地部署模型/国产plan等等后,你可以实现各家模型的混用。 通过多 Agent 分层,让 GPT5.5 做架构、拆任务、review 这些决策环节,DeepSeekV4flash、Qwen3.6Local 这种便宜的模型做执行——改代码、跑测试、修格式、查日志。贵的模型负责想,便宜模型负责做,实测可以至少节省一半的codex额度。 

你还可以把你的openai的oauth订阅专出openai compatible v1/responses 或者v1/chat格式把订阅拿去给你的智能体用,对外转出api接口

图片

通过这样的方法,你可以拿你openai订阅中的gpt5.5顶级模型给你开发的agent使用,比如我就把他接入到了我的图论agent中,教我学图论

图片

图片

如果说过去我们使用 Codex,是把它当作一个强大的单体智能体来用,那么 CCSwitchMulti 所做的事情,本质上是在打开另一种可能:让智能体之间互联协作,各司其职。

GPT-5.5 依然是那个最强的"大脑",负责想清楚方向、拍板方案、守住质量底线。而 DeepSeek、Qwen、GLM 们,则像一支训练有素的执行团队,把具体的活干完、干好。它们之间通过一套简单的路由规则串联起来,在同一个 Codex 工作流里无缝协作。

这其实也正是"智能体互联"这个方向的核心命题——

不是造一个更强的模型去包揽一切,而是让不同能力、不同成本的模型,在同一个系统里互联互通,按各自的优势分工。贵的做决策,便宜的做执行;云端做重推理,本地做高频调用。模型与模型之间、工具与工具之间、人与智能体之间,形成一张高效协作的网络。

CCSwitchMulti 只是这张网络里一个很小的节点。但它证明了一件事:智能体互联的落地门槛,比想象中低得多。 不需要等官方出新套餐,不需要换平台,只需要一个本地路由、几行规则配置,就能让你的 Codex 从"单兵作战"变成"团队协作"。

未来,我们还会在这个方向上继续探索。欢迎关注「智能体互联」,一起见证智能体协作时代的到来。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐