DeepSeek V4发布主动承认落后GPT半年,背后藏着国产AI算力大棋

文章简介
沉寂145天后,DeepSeek发布新版本V4,主动公开承认自身能力仍落后于GPT-5.4等前沿闭源模型3至6个月,打破国内AI圈发布惯例。DeepSeek V4延续激进低价策略,同时官宣全面适配华为昇腾生态,放弃英伟达CUDA,这是转向国产算力生态的主动战略布局。

上周五,时隔 145 天的 DeepSeek 新版本 V4 终于发布。技术报告的开头,没有“全球最强”,没有“打破垄断”,只有一句非常实诚的话:

“V4 的能力水平仍落后于 GPT-5.4 和 Gemini-3.1-Pro,发展轨迹大约滞后前沿闭源模型 3 至 6 个月。”

这句话出现在官方文档里,这在国内 AI 圈几乎是前所未有的操作 —— 大多数公司的基操是:只对比自己的上一代产品,或者只挑对自己有利的 benchmark。DeepSeek 反其道而行,把差距主动说了出来。

这是示弱吗?

图片

145 天的沉默

事情要从 2025 年底说起。

2025 年 12 月,DeepSeek 发布 V3.2 之后,整个团队似乎消失了。接下来的 145 天里,国产大模型赛道经历了春节 AI 大战、Agent 浪潮、OpenAI 发布 GPT-5、Anthropic 上线 Claude Opus 4.7、Kimi 发布 K2.6 —— 几乎所有重要节点,DeepSeek 都是缺席的。

缺席的代价是用户预期的反噬。2026 年 2 月,有用户发现 DeepSeek 的输出变得“冷淡”了:内容陈腐、老套、缺少温度,无论怎么调整提示词都不理想。社群里有开发者发起了“联名书”项目,要求 DeepSeek “找回自己”。还有人翻出 DeepSeek 早先的对话截图,对比现在的输出,发帖问:“DeepSeek 是不是变味了?”

面对这些质疑,DeepSeek 官方选择了沉默。有意思的是,流传最广的那条所谓的回应——“并非刻意冷淡,而是效率调整和边界感注重” —— 实际上是 DeepSeek AI 自己生成的,被外界当成了官方声明。

145 天的沉默,在外人看来近乎傲慢。但回头看,这更像是一场被动的“祛魅”:不是 DeepSeek 变弱了,而是竞争对手追上来了。当 Kimi K2.6 用 300 个 Agent 集群刷新了编程榜单,当 Claude Code 以 80.8% 的 SWE-bench 得分刷新了行业认知,DeepSeek 曾经的优势正在被迅速填平。

它需要时间。

一条免责条款

4 月 24 日,时间到了。

DeepSeek V4 正式开源:1.6 万亿参数,484 天研发,百万 token 超长上下文 —— 但最让业界意外的,是技术报告开头的那段“免责条款”。

DeepSeek 主动承认:V4 与 GPT-5.4 存在 3 至 6 个月差距。

这在国内 AI 发布惯例中几乎是禁忌。大多数公司只对比自己的 V3 vs V4,或者挑一个对标竞品的弱势维度,证明“我们在这个细分场景更强”。DeepSeek 没有这么做,它选了一个对自己最不利、但最诚实的表述方式。

这背后是一种信息策略:与其被别人扒出来,不如自己说出来。与其被动解释差距,不如主动掌握叙事主动权。行业内将这种操作称为“预期管理”—— 把最坏的结果提前释放,把最好的结果留给惊喜。反转的幅度越大,传播的势能越强。
DeepSeek V4 做到了。

价格利刃

技术报告发布的同时,DeepSeek 公布了另一组数据:V4-Pro 每百万 token 输入 1 元(缓存命中)或 12 元(缓存未命中),输出 24 元;V4-Flash 每百万 token 输入 0.2 元,输出 2 元。

这是什么概念? GPT-5.4 的同等上下文服务,价格大约是 DeepSeek 的十倍。换句话说:DeepSeek 从来不靠“最强”活着,它靠的是“最便宜”。

这不是 DeepSeek 第一次打价格战。早在 V3 时代,它就把 API 价格打到了几分钱百万 token 的级别,搅动了整个行业的定价逻辑。V4 延续了这一策略,而且更加激进:百万 token 上下文全系标配,不分版本,不加价。

这是价格的刀子。当别人还在比 benchmark 分数的时候,DeepSeek 已经把战场拉到了另一个维度:让所有用户都用得起长上下文,让 AI 能力真正下沉到中小企业和个人开发者。

另一个容易被忽视的细节是:DeepSeek 在公告末尾埋了一句话 —— “预计下半年昇腾 950 超节点批量上市后,Pro 的价格还会继续大幅下调。”这句话有两层意思。第一层是字面意思:价格还会降。但更重要的是第二层:DeepSeek 已经全面倒向华为昇腾生态,彻底放弃英伟达 CUDA。适配代码已经开源到 GitHub,FP4 精度格式是昇腾 950 原生支持的。

这才是那句“认输”背后真正的大棋。

比算法更重要的事

承认算法层面的差距,换取的是硬件层面的独立叙事。

在英伟达出口管制持续收紧的背景下,中国 AI 公司面临一个选择题:继续依赖 CUDA 生态,在英伟达的规则下竞争;或者换一条路,用国产算力重新定义游戏规则。

DeepSeek 选择了后者。

V4 发布当天,黄仁勋在一档播客节目中说了一句话:“DeepSeek 的进步意义重大,要是哪天像 DeepSeek 这样的成果先在华为平台上出现,那对美国会是非常糟糕的结果。”这句话经常被解读为对 DeepSeek 的赞美。

但如果仔细读,它更像是一种警告:美国需要警惕的不是 DeepSeek 的技术本身,而是 DeepSeek 可能带动的那条「非英伟达路径」—— 当中国 AI 公司开始用华为昇腾训练模型、用国产芯片构建生态,英伟达在数据中心市场的垄断地位就会受到真正的挑战。

DeepSeek 显然知道这一点。真正的竞争不在算法层,而在算力层。真正的差距不是 V4 落后 GPT-5.4 三个月,而是谁能建立起不依赖英伟达的完整 AI 生态。

从这个角度看,DeepSeek 的“认输”是一种战略转移:它主动降低外界对技术领先的期待,把注意力引导到生态建设上来。承认算法差距,换取政策认同;承认短期落后,换取长期叙事。

公告末尾

V4 发布公告的末尾,DeepSeek 引用了《荀子》的一句话:

“不诱于誉,不恐于诽,率道而行,端然正己。”

这句话出现在技术文档里,看起来有些突兀。但如果你理解了 DeepSeek 的处境,它其实是一个精心设计的收尾:

它回应了所有的唱衰 —— “不是我们不行了,是我们选择沉默专注做事”。

它也回应了所有的唱多 —— “不是我们多强,是我们选择不被赞誉绑架”。

更重要的是,它为接下来的一系列动作做了铺垫:接受腾讯、阿里的投资,启动成立以来的首次外部融资,把“自我供血”的神话转向“生态共建”的新叙事。DeepSeek 已经不是那个藏在杭州写代码的“隐士”了,它正在变成中国 AI 基础设施的一部分 —— 而基础设施需要盟友,需要资本,需要生态。

4 月 24 日之后,DeepSeek 的讨论重新热了起来。但讨论的焦点已经变了:不再是 DeepSeek 能不能打过 GPT,而是 DeepSeek 和华为的组合意味着什么。

这不是一个关于技术胜负的问题,这是一个关于比赛规则的问题。

参考链接

DeepSeek V4 官方公告: https://www.deepseek.com/newsDeepSeek-V4-Pro

模型页面(含技术报告链接): https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

DeepSeek 开放平台 API : https://platform.deepseek.com/

评论

发表评论

登录后可发表评论并对评论点赞。

去登录
暂无评论,快来发表第一条评论吧!