微软最近干了件事:禁止内部员工用Claude编程。官方说法是“成本超过人力”。扯淡。那点API费用,对微软什么也不是。

真正让他们睡不着觉的,是另一件事:模型会变。

你今天调通了一个代码生成逻辑,美滋滋上线。第二天,Claude静默更新了,同一个提示词,吐出来一堆藏着漏洞的函数。你找谁去?Anthropic(Claude的爹)只会耸耸肩:我们说了,尽力而为。

这不是想象。2025年有统计,六成用AI做核心业务的公司,都遇到过模型突然抽风。一半以上没法回滚。

像不像微信小程序?

你吭哧吭哧做了个小程序,微信一升级基础库,直接闪退。更绝的是鸿蒙微信,版本号从9.x掉到1.x,小程序们一看,版本太老了,拒绝运行。但其实底下API早就好了。

平台一跺脚,你家就地震。

AI这行,正在以更快的速度,冲进同一个粪坑。

一、所谓API,就是个笑话

搞软件的人都知道,API是契约。我传参,你返回,结果一样。今天调,明天调,一万次都一样。

大模型的API呢?它只约定了你用什么格式发请求。至于模型脑子怎么想的?不知道。输出是什么?看它心情。

这叫“尽力而为”。翻译成人话:出错了别怪我。

后果有三:

第一,锁不了版本。 多数模型就一个“latest”指针。你代码里写死了上个月的调法,但模型可能已经被偷偷换掉了。有团队发现GPT-4写代码的准确率一夜从92%掉到78%。想回滚?没门儿。

第二,行为没谱。 同一个问题,今天问和明天问,答案不一样。写诗算创意,审合同就是事故。

第三,不告诉你为啥。 它拒绝了一笔贷款,你问原因。它不会说“你第三行还款记录有问题”,而是现场编一段鬼话。

二、什么叫退出权?就是你能随时带着家当跑路

在旧世界,退出权是天经地义的。

你用SQL写查询,从Oracle换到MySQL,改几个词就行。你用Linux写程序,换到BSD也能编译。

AI世界呢?退出权被剁成了三块,每块都让人吐血。

第一块,数据锁死。 你为了微调一个审合同的模型,喂了几万份合同和人工标注。数据全在OpenAI服务器上。你想导出?可以,给你一堆乱糟糟的日志文件,不是JSON,不是CSV,别的模型根本不认。

第二块,行为锁死。 就算导出了数据,换个模型试试。同一个合同,GPT-4说“过”,Claude说“不过”,Llama 3说“再想想”。三家标准完全不一样。有家电商从GPT-4切到Claude做客服,意图识别准确率从94%摔到68%,折腾三个月才爬回来。

第三块,权重锁死——最狠的。 闭源模型的权重,你根本拿不到。你以为你在“微调”?不过是给别人的黑盒贴了几张贴纸。模型核心还是人家的。哪天OpenAI涨价、改政策、甚至关门,你投的所有钱和时间,一秒归零。

开源模型能解决权重锁死——Llama 3、Mistral、Qwen,随便下。但开源模型在复杂推理上还差一口气,而且各家格式不统一,微调完了也没有“说明书”,想对比、想组合,全是手工活。

三、厂商为什么不让你跑?因为跑了他就赚不到钱

别做梦了。厂商不给你退出权,不是技术做不到,是不想给。

你能无缝切换到竞品,他们就得打价格战、打性能战,利润薄如纸。所以他们的套路是:

第一,搞独家功能。我能看100万token,你不行;我能识图,你只能读文字。你的业务慢慢长在我的独门上,搬不动。

第二,偷偷改模型,不通知。反正条款写了“尽力而为”,你告不赢。

第三,坚决不让导出权重。你能拿走的只有日志,不是脑子。

这套路不新鲜。90年代浏览器大战,Netscape和IE各搞一套JavaScript扩展,开发者写个页面要测两家,骂声一片。后来标准组织出手,有了ECMAScript,才消停。

现在AI行业也到了这个节点。区别是,这次更难——因为模型行为是统计分布,不是代码。两个模型都可以说“我符合标准”,但边缘案例上,一个天一个地。

四、怎么破?三条路,都不好走,但得走

第一条,开源模型。 这是目前最实在的保底。Llama 3、Mistral、Qwen,直接下权重,放自己服务器跑。没人能卡你脖子。生态糙归糙,但社区动力足——因为大家都怕被锁。

第二条,定标准。 需要一份“模型行为契约”。就像SQL,不管底层是谁,SELECT * FROM users 返回的东西应该差不多。AI也要这样:一个审合同的模型,不管背后是GPT-4还是Claude,输入合同,输出{status, citations}。有了这个,你就能即插即用。OpenAI的函数调用格式已经成了非正式标准,但离“行为级契约”还差得远。

第三条,监管上强度。 欧盟AI法案已经在要透明度。下一步可能就是“可移植性”——跟GDPR让你搬个人数据一样,未来你可能有权利把微调数据和行为描述从OpenAI搬到Claude。美国NIST也在搞框架,里面提到了“可替换性”。监管虽慢,但落地了就是铁拳。

五、你现在该干什么?四件事,花不了多少时间

不管标准哪天来,你现在就能做的:

一,加一层壳。 别在业务代码里直接调OpenAI的SDK。包一层,换模型只改一个文件。半天的事,省未来几个月的命。

二,优先开源。 如果任务不是非得GPT-4才能干(比如代码生成、合同审核、客服分类),试试Llama 3或Qwen。性能差几个点,但你拥有自由。那比那几个点值钱。

三,自己建体检表。 针对核心任务,搞一百个测试用例。每次模型更新,跑一遍,看准确率掉没掉。别信厂商的benchmark,那是他们的题,不是你的。

四,数据攥在自己手里。 所有训练数据,要能批量导出,格式要自己能看懂。哪天换模型,带着这些数据走,就是带着你的知识库走。

六、没有退出权的繁荣,都是流沙上的财富

微信小程序的悲剧不是技术问题,是权力问题。你把生意盖在别人的地基上,人家跺跺脚,你就塌了。

AI行业的锁定比小程序更深——小程序至少还能锁一个版本号,AI模型连“版本”都糊在墙上。

好消息是,还来得及。接口标准和退出权不是科幻,SQL、POSIX、HTTP都走过这条路。坏消息是,窗口在关。一旦成千上万的业务逻辑嵌进了闭源黑盒,再想撬开,就是掰老虎的嘴。

没有退出权的繁荣,是负债,不是资产。

这句话在PC时代成立,在移动互联网时代成立,在AI时代只会更成立。因为你依赖的不再是操作系统或应用商店,而是一个会说话、会变脸、会撒谎的黑盒。

不给自己留后路,等于把公司的命,交给一个你控制不了的东西。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐