现在我们听到的模型太多了,比如国内有DeepSeek、豆包、GLM、千问等,国外有GPT、Claude、Gemini、Grok等。Agent是当前消耗最多Token的应用之一,根据相关榜单:https://arena.ai/leaderboard/agent 页面展示,以2026年6月19日情况,目前Agent方面顶级模型TOP3是:Claude Fable 5、GPT 5.5、GLM 5.2。

这里补充一句,GLM 5.2是国产开源的,🐮🍺。在主流编程基准上,GLM 5.2是开源模型中的SOTA

模型的使用不是免费的,这些模型部署的服务器通常在百万元以上,一般使用这些模型有两种计费方式:API计费、Coding Plan订阅。下图为4张H200 NVL通过NVLink连接,单张卡20万+

API方案

先说一下API计费方式,一般是使用百万Token计价,如果缓存命中,相应的Token计费约为一般输入的10%-20%,使用成熟的Agent缓存命中率可达80%以上。关于输入输出,根据任务不同,输入占比一般为50%-99%。

模型 输入约合人民币 输出约合人民币
Claude Fable 5 ≈ ¥72 / M tokens ≈ ¥360 / M tokens
GPT-5.5 ≈ ¥36 / M tokens ≈ ¥216 / M tokens
GLM-5.2 ¥8 / M tokens ¥28 / M tokens

那么我们可以来估算下价格了,对于普通对话来说,1000Token大约对应500个汉字或750个单词,普通对话一般输入输出为几千到几万个Token,以GLM 5.2模型为例,对应到价格大约就是0.5元左右,GPT与Claude的价格差不多直接乘10,好贵。

Coding Plan方案

先注意一下,Token Plan不是Coding Plan,在Claude Code中使用Token Plan几分钟可能100块的余额就没了,订阅Coding Plan时一定要注意!

下图是我某天用的GLM 5.1模型Token数量,71M。

按照官方API价格估计,按照100%输入,100%缓存命中来说(极限情况),如果使用API计费,大约花了142元。那我实际花了多少钱呢?一块五。 原因是我购买了GLM Coding Plan,一个月40多元,现在已经不太好抢了。需要补充一下,截图是GLM的老套餐,没有周限额,现在最新的套餐每个月只能使用几十M的Token(GLM 5.2),不过还是比API合适很多。

现在大模型厂商几乎都推出了自家Coding Plan方案,比如ChatGPT 的会员、Claude的套餐、国内MiniMax、Kimi等也有相应套餐,购买后可以接入Claude Code、OpenClaw、甚至是WorkBuddy。

我的选择是?

说了那么多,对于个人来说什么方案是兼顾实用和价格?我来讲下我的大模型付费策略,核心目标:顶尖模型、高可用

1. ChatGPT Plus 20$/月

这个优势在于:几乎没有数量限制的网页提问、GPT-Image-2图片生成次数,并且赠送了Codex额度可以直接在项目开发中使用GPT-5.5,用于中小型项目基本上够用。此外,还可以通过海鲜市场购买重置额度次数(限3次)。Codex与Claude Code是当前顶尖的Agent Harness已是圈内共识,为什么没充值Claude?一是早已习惯使用ChatGPT,第二是Claude的使用条件更苛刻,还容易封号。虽然GPT 5.5不及Fable 5,但也是非常够用了,GPT 5.5解决不了的问题,应该是我提问有问题。

2. GLM Coding Plan Lite ¥40/月

GLM旗舰系列模型从年初到现在,一直都是Agent的强模型。在可预见未来GLM模型还是挺靠谱的,无论是模型质量还是连接稳定性,都是让人很省心的存在,用来做一般的任务足够用了。

3. 官方API付费 ¥0-10/月

上面两个都是订阅的套餐,一般是只让用在特定的Agent中,在自建的网页问答及Agent应用中就不能用了,那咋办呢?目前我付费的有两个API,一个是DeepSeek的API,还有一个是GLM的API,一般会选择使用价格便宜且速度较快的模型,充10块钱可以用很久了。

4. 中转站 ¥0-10/月

还有一些特殊的需求,比如在做RAG时,需要GPT Embedding模型,有时也会用到gpt-image-2,这时国内官方API就不够用了。如果直接使用官方的API,首先需要设置网络环境,其次还要支付高额API费用,实在不太划算。这时一般我会用中转站,现在我用的中转站充API余额不到官方API价格的1折,GPT-Image-2生图约1毛一张,非广就不贴地址了。注意:中转站可能会泄漏隐私、偷换模型等,有一定风险。

总结

个人使用的方案月支出不到200元,可以满足顶级模型每月数亿Token使用,相当于API计费的1折左右,且不用担心天价账单。欢迎在留言区讨论你的Token方案。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐