人工智能大语言模型 DeepSeek V4 国产算力华为昇腾 GPT

DeepSeek V4发布主动承认落后GPT半年，背后藏着国产AI算力大棋

DeepBlog · 2026-04-28 · 8 分钟阅读 · 257 次浏览 ·开源生态

沉寂145天后，DeepSeek发布新版本V4，主动公开承认自身能力仍落后于GPT-5.4等前沿闭源模型3至6个月，打破国内AI圈发布惯例。DeepSeek V4延续激进低价策略，同时官宣全面适配华为昇腾生态，放弃英伟达CUDA，这是转向国产算力生态的主动战略布局。

上周五，时隔 145 天的 DeepSeek 新版本 V4 终于发布。技术报告的开头，没有“全球最强”，没有“打破垄断”，只有一句非常实诚的话：

“V4 的能力水平仍落后于 GPT-5.4 和 Gemini-3.1-Pro，发展轨迹大约滞后前沿闭源模型 3 至 6 个月。”

这句话出现在官方文档里，这在国内 AI 圈几乎是前所未有的操作 —— 大多数公司的基操是：只对比自己的上一代产品，或者只挑对自己有利的 benchmark。DeepSeek 反其道而行，把差距主动说了出来。

这是示弱吗？

145 天的沉默

事情要从 2025 年底说起。

2025 年 12 月，DeepSeek 发布 V3.2 之后，整个团队似乎消失了。接下来的 145 天里，国产大模型赛道经历了春节 AI 大战、Agent 浪潮、OpenAI 发布 GPT-5、Anthropic 上线 Claude Opus 4.7、Kimi 发布 K2.6 —— 几乎所有重要节点，DeepSeek 都是缺席的。

缺席的代价是用户预期的反噬。2026 年 2 月，有用户发现 DeepSeek 的输出变得“冷淡”了：内容陈腐、老套、缺少温度，无论怎么调整提示词都不理想。社群里有开发者发起了“联名书”项目，要求 DeepSeek “找回自己”。还有人翻出 DeepSeek 早先的对话截图，对比现在的输出，发帖问：“DeepSeek 是不是变味了？”

面对这些质疑，DeepSeek 官方选择了沉默。有意思的是，流传最广的那条所谓的回应——“并非刻意冷淡，而是效率调整和边界感注重” —— 实际上是 DeepSeek AI 自己生成的，被外界当成了官方声明。

145 天的沉默，在外人看来近乎傲慢。但回头看，这更像是一场被动的“祛魅”：不是 DeepSeek 变弱了，而是竞争对手追上来了。当 Kimi K2.6 用 300 个 Agent 集群刷新了编程榜单，当 Claude Code 以 80.8% 的 SWE-bench 得分刷新了行业认知，DeepSeek 曾经的优势正在被迅速填平。

它需要时间。

一条免责条款

4 月 24 日，时间到了。

DeepSeek V4 正式开源：1.6 万亿参数，484 天研发，百万 token 超长上下文 —— 但最让业界意外的，是技术报告开头的那段“免责条款”。

DeepSeek 主动承认：V4 与 GPT-5.4 存在 3 至 6 个月差距。

这在国内 AI 发布惯例中几乎是禁忌。大多数公司只对比自己的 V3 vs V4，或者挑一个对标竞品的弱势维度，证明“我们在这个细分场景更强”。DeepSeek 没有这么做，它选了一个对自己最不利、但最诚实的表述方式。

这背后是一种信息策略：与其被别人扒出来，不如自己说出来。与其被动解释差距，不如主动掌握叙事主动权。行业内将这种操作称为“预期管理”—— 把最坏的结果提前释放，把最好的结果留给惊喜。反转的幅度越大，传播的势能越强。
DeepSeek V4 做到了。

价格利刃

技术报告发布的同时，DeepSeek 公布了另一组数据：V4-Pro 每百万 token 输入 1 元（缓存命中）或 12 元（缓存未命中），输出 24 元；V4-Flash 每百万 token 输入 0.2 元，输出 2 元。

这是什么概念？ GPT-5.4 的同等上下文服务，价格大约是 DeepSeek 的十倍。换句话说：DeepSeek 从来不靠“最强”活着，它靠的是“最便宜”。

这不是 DeepSeek 第一次打价格战。早在 V3 时代，它就把 API 价格打到了几分钱百万 token 的级别，搅动了整个行业的定价逻辑。V4 延续了这一策略，而且更加激进：百万 token 上下文全系标配，不分版本，不加价。

这是价格的刀子。当别人还在比 benchmark 分数的时候，DeepSeek 已经把战场拉到了另一个维度：让所有用户都用得起长上下文，让 AI 能力真正下沉到中小企业和个人开发者。

另一个容易被忽视的细节是：DeepSeek 在公告末尾埋了一句话 —— “预计下半年昇腾 950 超节点批量上市后，Pro 的价格还会继续大幅下调。”这句话有两层意思。第一层是字面意思：价格还会降。但更重要的是第二层：DeepSeek 已经全面倒向华为昇腾生态，彻底放弃英伟达 CUDA。适配代码已经开源到 GitHub，FP4 精度格式是昇腾 950 原生支持的。

这才是那句“认输”背后真正的大棋。

比算法更重要的事

承认算法层面的差距，换取的是硬件层面的独立叙事。

在英伟达出口管制持续收紧的背景下，中国 AI 公司面临一个选择题：继续依赖 CUDA 生态，在英伟达的规则下竞争；或者换一条路，用国产算力重新定义游戏规则。

DeepSeek 选择了后者。

V4 发布当天，黄仁勋在一档播客节目中说了一句话：“DeepSeek 的进步意义重大，要是哪天像 DeepSeek 这样的成果先在华为平台上出现，那对美国会是非常糟糕的结果。”这句话经常被解读为对 DeepSeek 的赞美。

但如果仔细读，它更像是一种警告：美国需要警惕的不是 DeepSeek 的技术本身，而是 DeepSeek 可能带动的那条「非英伟达路径」—— 当中国 AI 公司开始用华为昇腾训练模型、用国产芯片构建生态，英伟达在数据中心市场的垄断地位就会受到真正的挑战。

DeepSeek 显然知道这一点。真正的竞争不在算法层，而在算力层。真正的差距不是 V4 落后 GPT-5.4 三个月，而是谁能建立起不依赖英伟达的完整 AI 生态。

从这个角度看，DeepSeek 的“认输”是一种战略转移：它主动降低外界对技术领先的期待，把注意力引导到生态建设上来。承认算法差距，换取政策认同；承认短期落后，换取长期叙事。

公告末尾

V4 发布公告的末尾，DeepSeek 引用了《荀子》的一句话：

“不诱于誉，不恐于诽，率道而行，端然正己。”

这句话出现在技术文档里，看起来有些突兀。但如果你理解了 DeepSeek 的处境，它其实是一个精心设计的收尾：

它回应了所有的唱衰 —— “不是我们不行了，是我们选择沉默专注做事”。

它也回应了所有的唱多 —— “不是我们多强，是我们选择不被赞誉绑架”。

更重要的是，它为接下来的一系列动作做了铺垫：接受腾讯、阿里的投资，启动成立以来的首次外部融资，把“自我供血”的神话转向“生态共建”的新叙事。DeepSeek 已经不是那个藏在杭州写代码的“隐士”了，它正在变成中国 AI 基础设施的一部分 —— 而基础设施需要盟友，需要资本，需要生态。

4 月 24 日之后，DeepSeek 的讨论重新热了起来。但讨论的焦点已经变了：不再是 DeepSeek 能不能打过 GPT，而是 DeepSeek 和华为的组合意味着什么。

这不是一个关于技术胜负的问题，这是一个关于比赛规则的问题。

参考链接

DeepSeek V4 官方公告: https://www.deepseek.com/newsDeepSeek-V4-Pro

模型页面（含技术报告链接）: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

DeepSeek 开放平台 API : https://platform.deepseek.com/

精选参考来源

DeepSeek-V4，就这？

发表评论

暂无评论，快来发表第一条评论吧！