梁文锋自掏 200 亿主导 DeepSeek 500 亿首融 — 拒了 3 年外部资本 / 只接国家队
5 月这一周 DeepSeek 干了三件事 ——
第一件:宣布首轮融资 500 亿人民币(约 70 亿美元),创下中国大模型公司单轮融资纪录。投后估值约 3500 亿人民币(515 亿美元)。
第二件:梁文锋个人自掏 200 亿人民币,占融资总额 40%,主导这轮定价。
第三件:5 月 22 日宣布 V4-Pro API 在 5/31 之后正式永久调整为原定价的 1/4 —— 比 GPT-5.5 输出价格便宜 30 多倍。同期国内其他大模型公司(字节豆包 / 智谱 GLM / 阿里通义 / 腾讯混元)都在涨价。
三件事单独拿出来都是大新闻。放在同一周,事情就有意思了 ——
这是一个 3 年里反复拒绝外部资本的创始人,在 2026 年 4 月突然改主意,并且用全行业最复杂的方式接资本。
这篇文章我想盘的,是梁文锋这场博弈,到底押下了什么。

3 年「不融资」是怎么一直挡过来的
2023 年 7 月 DeepSeek 成立那一天,梁文锋给这家公司划了一条线 ——
不接受外部融资 / 不稀释股权 / 不被任何人的商业化时间表绑架。
3 年里他真的做到了。
靠的是 DeepSeek 的母公司幻方量化 ——
- 2015 年梁文锋创办幻方,到 2021 年资产管理规模破千亿
- 跻身国内量化私募「四大天王」
- 2025 年幻方收益均值 56.55%,规模超 700 亿
- 2019 年「萤火一号」投入近 2 亿,1100 块 GPU
- 2021 年「萤火二号」投入 10 亿,约 1 万张英伟达 A100
用金融市场的短期超额收益,给技术研发的长期投入「输血」。这是梁文锋过去 7-8 年的全部策略。
3 年里他公开拒绝过的资本 ——
- 2024/2 联想创投高级合伙人宋春雨深入交流 → 「不融资」明确表态
- 2025/3 腾讯、阿里巴巴接触谈合作 → 否决
- 多家头部 VC(高瓴 / 红杉这一档)→ 长期不见
他给出的公开理由:
「DeepSeek 的目标是做世界顶级的通用大模型,不是为了赚钱,也不是为了上市。资本会追求短期回报,商业化会妥协技术路线,这些都会干扰我们的核心目标。」
这套话术在 AI 圈很罕见。今天能跟梁文锋讲这套话的,基本只剩 Ilya Sutskever 和 Anthropic 的 Dario Amodei。
为什么 2026 年 4 月,立场突然变了
4 月 17 日 The Information 报道 DeepSeek 启动首轮融资。整个投资圈炸了 ——
这位连续 3 年拒绝资本的人,为什么突然改主意?
4 个原因公开报道里都提到了 ——
一 · 算力成本撑不住了
V4 是 1.6 万亿参数的 MoE 模型,1M 上下文。这种规模训练 + 部署需要数万张算力卡,投入直接跳到 10 亿美元级别。
幻方 2025 年 56.6% 收益率算非常好的成绩 —— 但这点钱不够 V4 之后的 V4.1 / V5 路线烧。
二 · 核心人才 1 年内流失 5 个
- 罗福莉(V3 架构关键开发者)→ 小米接手 MiMo
- 王炳宣(DeepSeek LLM 核心作者)→ 腾讯
- 阮翀(多模态核心研究员)→ 元戎启行做首席科学家
- 魏浩然(OCR 核心作者)→ 2026 春节前后离开
- 郭达雅(R1 核心作者)→ 大厂
大厂给的薪酬包加上明确的期权变现路径,DeepSeek 无法对标。1 年丢 5 个核心,对一个 100 多人规模的研究型公司来说,是严重的人才警报。
三 · 期权没有锚点
DeepSeek 一直不融资 = 没有市场化估值。
意思是 —— 你给员工一个股权承诺,他拿到手里没法换算成真金白银。大厂期权有行权价、有内部回购、有 IPO 预期 —— DeepSeek 都没有。
外界知道 DeepSeek 很值钱。但到底值多少,员工自己都说不清。这是核心人才被挖走的核心原因之一。
四 · AI 竞争进入「四轮驱动」
模型 / 产品 / 生态 / 资本 —— 现在缺一个都不行。
你可以有全球最好的模型。但如果没有资本背书 + 产业生态,最后只是产业链里一个高级供应商,看别人拿你的模型赚钱。
OpenAI / Anthropic 已经把这个剧本演了 2 年。DeepSeek 不能再装看不见。

500 亿融资为什么这么精巧
梁文锋的设计是这样的 ——
估值 3 周从 100 亿涨到 515 亿美元(5 倍)
- 2026/4 初 启动融资,估值约 100 亿美元
- 2026/4/22 估值超过 200 亿美元(腾讯、阿里洽谈)
- 2026/5/6 估值约 450 亿美元(国家大基金洽谈领投)
- 2026/5 上旬 部分报道称最终估值可达 500-515 亿美元
3 周时间,4 次改写。这种节奏只有创始人手里有绝对控制权才能玩得动。
自掏 200 亿主导定价
这是这场博弈最关键的动作 ——
- 梁文锋自掏 200 亿,占融资 40%
- 持股结构从原 89.5% → 通过直接 + 间接合计控制 84.29%
- 等于自己给自己定价,让外部投资人「接受我的报价 或 不来」
这是中国创业史上极少见的「创始人自掏过半数轮融资」结构。一般创始人融资是「我同意稀释多少股份」,梁文锋是「我自己出大头钱 + 你们按我的价跟」。
这种打法只有两种创始人能用 —— 一种是巨富(梁文锋身价 2025 年至少 100 亿人民币级,幻方分红撑得起);另一种是有绝对技术信念的(OpenAI 早期 Sam Altman 也用过类似策略)。梁文锋两条都占。
只接两种钱 / 拒绝两种钱
接 ——
- 国家大基金(第二大投资方 / 首次公开布局国内头部大模型)
- 腾讯 60 亿入约 2% 股权(小比例 / 拿不到话语权)
- 其他国资 + 产业资本
拒 ——
- 高瓴 / 红杉 / 等头部财务 VC(追求 3-5 年退出 / 跟「长期主义」冲突)
- 阿里(谈崩 / 双方在条款上没达成一致)
这种筛选反映的是 —— 梁文锋要的不是钱,是「钱本身带的属性」。
国家大基金过去主要投半导体硬件(中芯国际 / 长江存储),首次切入大模型,意味着国家资本认中国 AI 软硬一体生态的押注。
腾讯只给 2%,拿不到决策权但给得到流量和合作 —— 是「桥梁型资本」。
阿里谈崩 —— 因为阿里既要技术合作又要话语权,跟梁文锋的「我说了算」逻辑直接冲突。
同周 V4-Pro 永降 30+ 倍 — 这是行业一记重锤
5 月 22 日官宣 ——
V4-Pro API 价格在 5/31 15:59 UTC 后,正式调整为原定价的 1/4。
具体价格 ——
- 缓存命中输入:0.025 元 / 百万 token
- 缓存未命中输入:3 元 / 百万 token
- 输出:6 元 / 百万 token
对比 ——
- GPT-5.5 输出价格约 216 元 / 百万 token(DeepSeek 便宜 36 倍)
- 通义千问 Qwen3.5-Plus:0.8 元输入 / 1.6 元输出
- 文心一言旗舰版:10 元输入 / 20 元输出
- 智谱 GLM-5:12 元输入
DeepSeek 缓存命中输入价格已经进入「分厘级」 —— 业界从来没有过。
更重要的是 —— 这一波永久降价,发生在国内其他大模型公司集体涨价的同一时间窗口 ——
- 字节豆包推出付费订阅
- 智谱 GLM 三次上调 API 价格
- 阿里云 + 腾讯云 API 提价 5%
DeepSeek 一个人走另一个方向。
这不是简单的「卷价格」 —— 是梁文锋在用价格圈住开发者入口。
融完资就降价,把这种「我有钱可以一直补贴」的姿势直接亮给市场看。被卷的不是别人,是字节 / 阿里 / 腾讯。

我的几个判断
一:这场融资不是梁文锋认输 — 是他认账了一件事:技术理想主义在 2026 年单挑不过 AI 资本规模。他用 200 亿自掏的方式 + 国家队 / 产业资本筛选,把这件事做到「保全战略自主 + 同时拿到资本背书」的最优解
二:500 亿融资里最贵的不是钱 — 是估值锚点。员工期权终于能换算成真金白银。1 年丢 5 个核心研发骨干这件事,是融资最关键的导火索
三:拒绝高瓴 / 红杉这种财务 VC、只接国家队 + 产业资本 — 这意味着 DeepSeek 不打算走「3-5 年退出」的传统创投剧本。这是一家长期主义公司接受了长期主义资本的最优配对
四:V4-Pro 永久降价 30+ 倍 + 行业其他公司同期涨价 — DeepSeek 在用价格圈开发者。融资 500 亿 + 国家队背书 + 永降价 = 一个能持续补贴开发者 5 年以上的位置。这是字节豆包 / 阿里通义 / 智谱 / 月之暗面都模仿不了的姿态
五:6 月 DeepSeek-V4.1 发布 + 商业化提速 + 国产芯片(昇腾 / 寒武纪 / 海光)算力栈全面接入 — 这条线如果跑通,DeepSeek 会在 12 个月内变成全球前 5 大 AI 公司之一,但前提是核心人才不再继续流失
2023 年 7 月梁文锋宣布不融资。
2026 年 4 月他改主意。
2026 年 5 月他自掏 200 亿主导首轮 500 亿融资,拒了所有财务 VC,只接国家队和产业资本。
同一周他把 API 价格永久降到原价 1/4,把开发者入口锁住。
3 年「不接资本」+ 1 周「接 500 亿」 — 这不是矛盾,是同一个判断的两面。
梁文锋押下的不是钱。是「我的方向 + 我说了算」这件事,在 AI 全球竞赛进入下半场时仍然能继续走得下去。
这一笔押注成不成 — 12-18 个月后看 V4.1 / V5 / 国产算力栈 / 核心人才稳定度 — 四件事任何一件出问题,3500 亿估值都立不住。
但梁文锋这种自掏 200 亿赌自己定价权的玩法 — 5 年内国内 AI 公司里大概没有第二个人能用。
这也是 DeepSeek 跟字节 / 阿里 / 腾讯 / 月之暗面之间最大的差距 —— 不是模型,是创始人的位置。
更多推荐


所有评论(0)