DeepSeek V4：这个中国 AI 模型，决定不带英伟达玩了

人工智能AI技术

503人浏览 · 2026-04-04 20:15:12

人工智能AI技术 · 2026-04-04 20:15:12 发布

文章目录

前言

DeepSeek 把 V4 的发布推迟了几个月。
不是为了憋大招，而是为了干一件更硬的事：让模型跑在国产芯片上。

朋友们，这事儿有多硬呢？打个比方，就像你本来开着保时捷在高速公路飙车，突然决定要把发动机换成自主研发的，而且还要保证速度不降，甚至更快。这在 AI 圈，简直是"自杀式"挑战。

但梁文锋就这么干了。

一、从"春节见"到"四月见"：一场漫长的等待

熟悉 DeepSeek 的朋友们都知道，这家公司的发布节奏一向很"卷"。2025 年那会儿，他们几乎是月更，V3、R1、V3.2 一个接一个，打得对手喘不过气。但自从 2025 年 12 月 V3.2 发布之后，DeepSeek 突然"断更"了。

按照外界的预期，V4 应该在 2026 年春节前后亮相。毕竟那时候豆包、千问、元宝都在扎堆发新版，生怕晚一步就被 V4 的光芒盖过。春节过了，没动静；2 月中旬，继续等；3 月初，大家伸长脖子，结果等来的却是"服务器繁忙"的宕机通知。

3 月 29 日晚上，DeepSeek 经历了一次长达 13 小时的大规模服务中断。网页端、App 全面卡顿，"服务器繁忙"的提示刷屏，相关话题瞬间冲上热搜前十。技术社区里有人猜测：这哪是故障，分明是 V4 在做"隐身测试"啊。

你别说，这种猜测还真有迹可循。早在 2 月 11 日，DeepSeek 就悄悄把现有模型的上下文窗口从 128K 扩展到了 1M tokens，知识截止也更新到了 2025 年 5 月。这种基础设施级别的升级，怎么看都像是在给 V4 铺路。

二、不带英伟达玩：一场釜底抽薪的豪赌

好了，重点来了。为什么 V4 要推迟这么久？ Reuters 的一则报道揭开了谜底：DeepSeek 在即将进行重大模型更新之前，未向英伟达展示其即将推出的旗舰模型，这打破了行业标准做法。

这意味着什么？

咱们都知道，英伟达能撑起万亿市值，靠的不仅仅是 GPU 硬件，还有那打磨了十几年的 CUDA 软件生态。CUDA 就像是给全球 AI 开发者铺好的高速公路，你沿着走总能"大力出奇迹"。但 DeepSeek 这次要做的，是铺一条"绕过 CUDA"的国道，而且要走通。

据 icsmart 报道，DeepSeek V4 已基于包括华为在内的最新国产 AI 芯片进行了深度优化。这里说的主要是华为昇腾 950PR（Ascend 950PR）处理器，这款芯片在 2026 年 3 月 21 日的华为中国合作伙伴大会上正式发布。

咱们来看看这块芯片的硬实力：算力达到 1PFLOPS（FP8）/ 2PFLOPS（FP4），HBM 容量 128GB，互联带宽 2TB/s。与英伟达 H20 相比，昇腾 950PR 的 HBM 容量是 H20 的 1.16 倍，多模态生成速度可以提升 60%。

更夸张的是，阿里巴巴、字节跳动与腾讯等中国科技巨头，已经提前下单了数十万颗华为新一代 AI 芯片，就是为了应对基于 V4 的云服务上线需求。

这就好比一场游戏，英伟达本来是唯一的"显卡供应商"，所有玩家都得找他买装备。现在 DeepSeek 说：我要自己造一套装备，而且还要带上一帮兄弟一起用。这已经不是技术问题，这是生态战争。

三、万亿参数+长期记忆：V4 到底强在哪？

当然，光是换芯片还不够，V4 本身的技术升级同样吓人。

据外媒报道，V4 可能采用万亿参数的 MoE（混合专家）架构，但每次推理只激活 320 亿参数。这是什么概念？你能用到万亿参数的能力，只需要付 320 亿参数的钱。这就像是花经济舱的钱，享受头等舱的服务，典型的 DeepSeek 式"暴力美学"。

但最让我兴奋的，是一个叫 LTM（Long-Term Memory，长期记忆）的技术。现在的 AI，说白了就是"金鱼脑子"，聊完就忘。虽然 OpenClaw 这类产品可以通过往本地文件里写笔记来"假装记得"，但本质上还是把历史记录塞进上下文，用久了 token 消耗爆炸，成本感人。

而 LTM 要做的，是把记忆能力直接嵌入模型架构本身。根据梁文锋 2026 年 1 月署名发表的论文《Conditional Memory via Scalable Lookup》，DeepSeek 提出了一种条件记忆机制，能让 AI 跨对话、跨任务地记住用户是谁、聊过什么、偏好什么。

打个比方，现在的 AI 每次对话都像刚认识你的陌生人，而有了 LTM，AI 就像你的老朋友，知道你爱吃辣、知道你最近在忙项目、知道你之前讨论过的问题卡在哪。这种"人情味"，才是 AI 真正走向实用的关键。

此外，V4 还可能是原生多模态，从架构层面就支持图片、视频、文本的理解和生成，而不是像现在这样后期拼接。知识截止也可能更新到 2026 年 1 月，基本追平当前时间线。

四、反内卷的团队：为什么敢这么慢？

说到这，你可能会问：DeepSeek 凭什么敢这么慢？换成别的公司，面对全行业翘首以盼的局面，早就把半成品推出去了。先占声量，再慢慢迭代，这是互联网行业的基本操作。

但梁文锋偏不。

据 i黑马报道，DeepSeek 的工作节奏在全球 AI 实验室中独树一帜。多数员工下午 6 到 7 点下班，早上不打卡，没有明确绩效考核。梁文锋认为，一个人每天能高质量工作的时间很难超过 6 到 8 小时，加班疲劳下的昏庸判断反而会浪费算力，得不偿失。

这种"反内卷"文化，让 DeepSeek 更像一个研究实验室，而不是传统意义上的营利性企业。虽然近期有核心成员被腾讯等巨头以 2-3 倍薪酬挖走，但更多人选择了留下。

对梁文锋来说，"不发"永远比"发错"重要。R1 之所以能一炮封神，靠的不是抢跑，而是一出手就让对手无话可说。他显然打算用同样的方式对待 V4——要么不发，要发就是王炸。

五、慢下来，是为了跳得更远

2025 年，DeepSeek 用 V3 和 R1 证明了"中国模型"可以硬刚 OpenAI。2026 年，当 OpenAI 和 Anthropic 进入"月更模式"疯狂刷存在感时，DeepSeek 却选择了慢下来。

这种慢，不是掉队，而是蓄力。从单纯刷榜转向构建 Agent 系统工程，从依赖英伟达转向适配国产芯片，从"更聪明的模型"转向"真正可执行的系统"。这些转变，每一项都是架构级的重构，都不是小修小补能解决的。

正如林俊旸所说，AI 时代正从"推理式思维"转向"智能体思维"。未来的主流不再是"想更久"，而是"为了行动而想"。DeepSeek V4 的推迟，恰恰是在为这个时代做准备。

所以，当 V4 真正发布的那一天，我们看到的不会只是一个更强的模型，而是一个"国产大模型+国产芯片"的完整闭环，是一个能记住你、理解你、帮你在真实环境里干活的智能体。

这场等待，值得。

朋友们，如果你也对 AI 感兴趣，想了解 DeepSeek V4 的最新进展，记得关注我。咱们下篇文章见！

目前国内还是很缺AI人才的，希望更多人能真正加入到AI行业，共同促进行业进步，增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow，教程通俗易懂，高中生都能看懂，还有各种段子风趣幽默，从深度学习基础原理到各领域实战应用都有讲解，我22年的AI积累全在里面了。注意，教程仅限真正想入门AI的朋友，否则看看零散的博文就够了。

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

爆改增强 Codex App，API 用户不再尴尬

用 API 跑 Codex 的人，最烦的往往不是模型不够强，而是桌面体验少一块。官方账号的插件、Goal、Computer Use 是完整的，你走 API 或第三方模型，胜在自由，但很多体验不一定都有。Codex++ 火起来，就是因为它盯上了这个缝。先别误会，因为 Codex App 本来就有官方插件、集成和 MCP。Codex++ 这个项目不是 OpenAI 官方功能，也不是官方插件商店。它是玩

AI编程社区

React Page组件化开发：掌握Facebook推荐的组件组织架构

React Page是Facebook官方推出的React应用开发框架，专为组件化开发而设计。这个强大的工具让您能够轻松构建服务器端渲染的React应用，实现快速页面加载和优秀的SEO效果。React Page组件化开发的核心思想是将整个页面视为可组合的组件，这正是Facebook推荐的现代化前端架构模式。## 为什么选择React Page组件化开发？ 🚀React Page提供了一个