梁文锋自掏 200 亿主导 DeepSeek 500 亿首融 — 拒了 3 年外部资本 / 只接国家队

乔氪智造

283人浏览 · 2026-05-29 18:31:52

乔氪智造 · 2026-05-29 18:31:52 发布

5 月这一周 DeepSeek 干了三件事 ——

第一件：宣布首轮融资 500 亿人民币（约 70 亿美元），创下中国大模型公司单轮融资纪录。投后估值约 3500 亿人民币（515 亿美元）。

第二件：梁文锋个人自掏 200 亿人民币，占融资总额 40%，主导这轮定价。

第三件：5 月 22 日宣布 V4-Pro API 在 5/31 之后正式永久调整为原定价的 1/4 —— 比 GPT-5.5 输出价格便宜 30 多倍。同期国内其他大模型公司（字节豆包 / 智谱 GLM / 阿里通义 / 腾讯混元）都在涨价。

三件事单独拿出来都是大新闻。放在同一周，事情就有意思了 ——

这是一个 3 年里反复拒绝外部资本的创始人，在 2026 年 4 月突然改主意，并且用全行业最复杂的方式接资本。

这篇文章我想盘的，是梁文锋这场博弈，到底押下了什么。

3 年「不融资」是怎么一直挡过来的

2023 年 7 月 DeepSeek 成立那一天，梁文锋给这家公司划了一条线 ——

不接受外部融资 / 不稀释股权 / 不被任何人的商业化时间表绑架。

3 年里他真的做到了。

靠的是 DeepSeek 的母公司幻方量化 ——

2015 年梁文锋创办幻方，到 2021 年资产管理规模破千亿
跻身国内量化私募「四大天王」
2025 年幻方收益均值 56.55%，规模超 700 亿
2019 年「萤火一号」投入近 2 亿，1100 块 GPU
2021 年「萤火二号」投入 10 亿，约 1 万张英伟达 A100

用金融市场的短期超额收益，给技术研发的长期投入「输血」。这是梁文锋过去 7-8 年的全部策略。

3 年里他公开拒绝过的资本 ——

2024/2 联想创投高级合伙人宋春雨深入交流 → 「不融资」明确表态
2025/3 腾讯、阿里巴巴接触谈合作 → 否决
多家头部 VC（高瓴 / 红杉这一档）→ 长期不见

他给出的公开理由：

「DeepSeek 的目标是做世界顶级的通用大模型，不是为了赚钱，也不是为了上市。资本会追求短期回报，商业化会妥协技术路线，这些都会干扰我们的核心目标。」

这套话术在 AI 圈很罕见。今天能跟梁文锋讲这套话的，基本只剩 Ilya Sutskever 和 Anthropic 的 Dario Amodei。

为什么 2026 年 4 月，立场突然变了

4 月 17 日 The Information 报道 DeepSeek 启动首轮融资。整个投资圈炸了 ——

这位连续 3 年拒绝资本的人，为什么突然改主意？

4 个原因公开报道里都提到了 ——

一 · 算力成本撑不住了

V4 是 1.6 万亿参数的 MoE 模型，1M 上下文。这种规模训练 + 部署需要数万张算力卡，投入直接跳到 10 亿美元级别。

幻方 2025 年 56.6% 收益率算非常好的成绩 —— 但这点钱不够 V4 之后的 V4.1 / V5 路线烧。

二 · 核心人才 1 年内流失 5 个

罗福莉（V3 架构关键开发者）→ 小米接手 MiMo
王炳宣（DeepSeek LLM 核心作者）→ 腾讯
阮翀（多模态核心研究员）→ 元戎启行做首席科学家
魏浩然（OCR 核心作者）→ 2026 春节前后离开
郭达雅（R1 核心作者）→ 大厂

大厂给的薪酬包加上明确的期权变现路径，DeepSeek 无法对标。1 年丢 5 个核心，对一个 100 多人规模的研究型公司来说，是严重的人才警报。

三 · 期权没有锚点

DeepSeek 一直不融资 = 没有市场化估值。

意思是 —— 你给员工一个股权承诺，他拿到手里没法换算成真金白银。大厂期权有行权价、有内部回购、有 IPO 预期 —— DeepSeek 都没有。

外界知道 DeepSeek 很值钱。但到底值多少，员工自己都说不清。这是核心人才被挖走的核心原因之一。

四 · AI 竞争进入「四轮驱动」

模型 / 产品 / 生态 / 资本 —— 现在缺一个都不行。

你可以有全球最好的模型。但如果没有资本背书 + 产业生态，最后只是产业链里一个高级供应商，看别人拿你的模型赚钱。

OpenAI / Anthropic 已经把这个剧本演了 2 年。DeepSeek 不能再装看不见。

500 亿融资为什么这么精巧

梁文锋的设计是这样的 ——

估值 3 周从 100 亿涨到 515 亿美元（5 倍）

2026/4 初启动融资，估值约 100 亿美元
2026/4/22 估值超过 200 亿美元（腾讯、阿里洽谈）
2026/5/6 估值约 450 亿美元（国家大基金洽谈领投）
2026/5 上旬部分报道称最终估值可达 500-515 亿美元

3 周时间，4 次改写。这种节奏只有创始人手里有绝对控制权才能玩得动。

自掏 200 亿主导定价

这是这场博弈最关键的动作 ——

梁文锋自掏 200 亿，占融资 40%
持股结构从原 89.5% → 通过直接 + 间接合计控制 84.29%
等于自己给自己定价，让外部投资人「接受我的报价或不来」

这是中国创业史上极少见的「创始人自掏过半数轮融资」结构。一般创始人融资是「我同意稀释多少股份」，梁文锋是「我自己出大头钱 + 你们按我的价跟」。

这种打法只有两种创始人能用 —— 一种是巨富（梁文锋身价 2025 年至少 100 亿人民币级，幻方分红撑得起）；另一种是有绝对技术信念的（OpenAI 早期 Sam Altman 也用过类似策略）。梁文锋两条都占。

只接两种钱 / 拒绝两种钱

接 ——

国家大基金（第二大投资方 / 首次公开布局国内头部大模型）
腾讯 60 亿入约 2% 股权（小比例 / 拿不到话语权）
其他国资 + 产业资本

拒 ——

高瓴 / 红杉 / 等头部财务 VC（追求 3-5 年退出 / 跟「长期主义」冲突）
阿里（谈崩 / 双方在条款上没达成一致）

这种筛选反映的是 —— 梁文锋要的不是钱，是「钱本身带的属性」。

国家大基金过去主要投半导体硬件（中芯国际 / 长江存储），首次切入大模型，意味着国家资本认中国 AI 软硬一体生态的押注。

腾讯只给 2%，拿不到决策权但给得到流量和合作 —— 是「桥梁型资本」。

阿里谈崩 —— 因为阿里既要技术合作又要话语权，跟梁文锋的「我说了算」逻辑直接冲突。

同周 V4-Pro 永降 30+ 倍 — 这是行业一记重锤

5 月 22 日官宣 ——

V4-Pro API 价格在 5/31 15:59 UTC 后，正式调整为原定价的 1/4。

具体价格 ——

缓存命中输入：0.025 元 / 百万 token
缓存未命中输入：3 元 / 百万 token
输出：6 元 / 百万 token

对比 ——

GPT-5.5 输出价格约 216 元 / 百万 token（DeepSeek 便宜 36 倍）
通义千问 Qwen3.5-Plus：0.8 元输入 / 1.6 元输出
文心一言旗舰版：10 元输入 / 20 元输出
智谱 GLM-5：12 元输入

DeepSeek 缓存命中输入价格已经进入「分厘级」 —— 业界从来没有过。

更重要的是 —— 这一波永久降价，发生在国内其他大模型公司集体涨价的同一时间窗口 ——

字节豆包推出付费订阅
智谱 GLM 三次上调 API 价格
阿里云 + 腾讯云 API 提价 5%

DeepSeek 一个人走另一个方向。

这不是简单的「卷价格」 —— 是梁文锋在用价格圈住开发者入口。

融完资就降价，把这种「我有钱可以一直补贴」的姿势直接亮给市场看。被卷的不是别人，是字节 / 阿里 / 腾讯。

我的几个判断

一：这场融资不是梁文锋认输 — 是他认账了一件事：技术理想主义在 2026 年单挑不过 AI 资本规模。他用 200 亿自掏的方式 + 国家队 / 产业资本筛选，把这件事做到「保全战略自主 + 同时拿到资本背书」的最优解

二：500 亿融资里最贵的不是钱 — 是估值锚点。员工期权终于能换算成真金白银。1 年丢 5 个核心研发骨干这件事，是融资最关键的导火索

三：拒绝高瓴 / 红杉这种财务 VC、只接国家队 + 产业资本 — 这意味着 DeepSeek 不打算走「3-5 年退出」的传统创投剧本。这是一家长期主义公司接受了长期主义资本的最优配对

四：V4-Pro 永久降价 30+ 倍 + 行业其他公司同期涨价 — DeepSeek 在用价格圈开发者。融资 500 亿 + 国家队背书 + 永降价 = 一个能持续补贴开发者 5 年以上的位置。这是字节豆包 / 阿里通义 / 智谱 / 月之暗面都模仿不了的姿态

五：6 月 DeepSeek-V4.1 发布 + 商业化提速 + 国产芯片（昇腾 / 寒武纪 / 海光）算力栈全面接入 — 这条线如果跑通，DeepSeek 会在 12 个月内变成全球前 5 大 AI 公司之一，但前提是核心人才不再继续流失

2023 年 7 月梁文锋宣布不融资。

2026 年 4 月他改主意。

2026 年 5 月他自掏 200 亿主导首轮 500 亿融资，拒了所有财务 VC，只接国家队和产业资本。

同一周他把 API 价格永久降到原价 1/4，把开发者入口锁住。

3 年「不接资本」+ 1 周「接 500 亿」 — 这不是矛盾，是同一个判断的两面。

梁文锋押下的不是钱。是「我的方向 + 我说了算」这件事，在 AI 全球竞赛进入下半场时仍然能继续走得下去。

这一笔押注成不成 — 12-18 个月后看 V4.1 / V5 / 国产算力栈 / 核心人才稳定度 — 四件事任何一件出问题，3500 亿估值都立不住。

但梁文锋这种自掏 200 亿赌自己定价权的玩法 — 5 年内国内 AI 公司里大概没有第二个人能用。

这也是 DeepSeek 跟字节 / 阿里 / 腾讯 / 月之暗面之间最大的差距 —— 不是模型，是创始人的位置。

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

爆改增强 Codex App，API 用户不再尴尬

用 API 跑 Codex 的人，最烦的往往不是模型不够强，而是桌面体验少一块。官方账号的插件、Goal、Computer Use 是完整的，你走 API 或第三方模型，胜在自由，但很多体验不一定都有。Codex++ 火起来，就是因为它盯上了这个缝。先别误会，因为 Codex App 本来就有官方插件、集成和 MCP。Codex++ 这个项目不是 OpenAI 官方功能，也不是官方插件商店。它是玩

AI编程社区

2026 年 GPT Plus 充值怎么选？几种订阅方式和避坑建议

2026年ChatGPT Plus充值建议：优先考虑稳定与安全。官方订阅20美元/月（不含API费用），适合有海外支付能力的用户；手机端用户可通过应用商店订阅；支付困难者可选择靠谱第三方渠道，需关注开通方式、续费及售后保障。警惕低价陷阱、共享账号和"永久会员"噱头，区分Plus订阅与API计费。团队用户建议评估高阶方案。核心原则是长期使用的稳定性优于短期低价，根据自身需求选择合