
最近有个大事,DeepSeek V4来了。它很可能是过去18个月最受期待的人工智能模型。我们正处于OpenAI刚刚发布GPT-5.5的阶段,DeepSeek于同一天发布了V4。基本上没有时间可以浪费——如果你在人工智能领域错过了哪怕一天,你可能会发现自己永远处于下层阶级。

DeepSeek V4拥有1.6万亿个参数。此前最大的开源模型大约是1000亿参数级别,V4比之前领先的开源模型大了约60%。它采用混合专家架构(MoE),并非所有参数在每次推理时都被激活,每条消息实际只有约470亿参数处于活跃状态。上下文窗口名义上达到一百万token,但有一些注意事项。毫无疑问,它是迄今为止最强大的开源模型。

主要新特性包括稀疏注意力机制,以及在长上下文中对残余注意力进行高度压缩的技术。它使用了与Kimi相同的优化器,受到Kimi 2.5启发——这正是开源社区的美妙之处,大家互相汲取灵感,因为一切都是开源的。此外还有路由技巧、FP4和FP8推理,以及多级策略蒸馏等创新。

这个模型如此优秀,却并非在最好的硬件上训练,这本身就说明了很多。美国和欧盟对中国实施了多项GPU出口限制和管控。ASML拥有全球最先进的EUV光刻机,每台造价约5亿美元,而中国受出口管制无法购买。因此DeepSeek不得不混合使用华为昇腾GPU和较旧的英伟达GPU。想象一下,如果他们拥有最好、最新的设备,这个模型的表现可能会更加惊人。

V4有Pro和Flash两个版本。在MMLU上与GPT-5.4差不多,略低于Opus 4.6;简单问答方面实际超过了Opus和GPT;在Live Code Bench和Codeforces上表现最佳。代理编码方面,Terminal Bench上比Opus更好但比GPT-5.4稍差,SWE Bench上与Opus 4.6相当,浏览器控制能力比GPT好但比Opus稍差。总结来说,中国在几个热门基准上已经迎头赶上,不过在更困难的基准上仍落后于Opus。

V4比Opus 4.7便宜7倍,比GPT-5.5 Pro便宜40倍。你可以以七分之一的价格获得97%的性能,这是非常好的折衷方案。以我自己为例,每月在API上花费5000-6000美元,V4发布后将大幅降至500-1000美元。可以预见,很多公司和个人会将代理和自动化工作流迁移到V4——中国提供了可在自己GPU上托管的开源模型,比美国模型便宜7倍且智能相当,谁不接受呢?

第一,长上下文性能衰减严重。128K至180K token后性能急剧下降,虽然名义上支持百万级上下文,但实际不建议超过200K。第二,在GPQA HL、SWE Pro等高难度基准上,GPT-5.5和Opus 4.7仍更胜一筹。第三,训练周期漫长,从R1到V4历时约14至16个月,原因包括出口管制导致需从英伟达切换到华为芯片,以及训练中经历一次重大失败。第四,模型存在部分话题限制,涉及台湾地区等敏感地缘政治议题时回答受限。第五,生态工具尚未就绪,模型需自定义的DSML和XML工具调用格式,目前许多代理框架还没有适配,人们需要几周时间来摸索。

目前使用V4最便捷的编码代理方式是开源工具OpenCode。我同时开了4个终端,分别让V4 Pro构建架构可视化、SVG植物动画、卡丁车游戏、系外行星展示4个不同项目。当前推理速度较慢,因为模型太大,预计需要几周才能看到优化的推理服务出现。4个终端并行运行约15至20分钟,总成本仅0.2美元;若使用Opus 4.6估计要花100至200美元。
这个模型在性能上并非绝对的革命性突破,但在性价比方面绝对是全新标杆。它比Sonnet 4.6更好,与Opus 4.6和GPT-5.4处于同一水平,略低于GPT-5.5和Opus 4.7。以如此低的价格提供这样的能力,确实令人惊叹。

然而,V4的技术实力有目共睹的同时,围绕它的地缘博弈更加白热化。就在V4发布前一天,白宫科技政策办公室主任克拉西奥斯签发措辞激烈的备忘录,指控"主要位于中国"的实体对美国前沿AI系统开展大规模"蒸馏"窃取行动。
美国众议院外交事务委员会同日推出法案要求制裁相关外国实体,路透社披露的外交电报显示美国国务院已向全球外交机构发出警告。从白宫到国务院到国会三路齐下,目的很清楚:先把中国AI定性为"赃物",再推动制裁。
但V4捅破了一层窗户纸——它首发适配华为昇腾等8家国产芯片,早期访问权限独家开放给国产芯片厂商,标志着中国前沿AI模型可以不依赖英伟达体系独立运行。
当开源模型能提供闭源产品八九成的能力、价格仅为十分之一,且可在国产芯片上运行不受出口禁令约束——任何理性的企业决策者都知道该怎么选。"不能让世界建立在中国的开源模型之上"——美国喊得越响,越暴露出一个他们不愿面对的事实:这个世界,已经开始建立了。

据彭博社4月26日报道,V4延迟发布的根本原因是团队将战略重心转向与华为昇腾芯片的深度适配优化,而非仅追求快速迭代。
4月27日,中国信通院宣布联合国家信创园正式启动DeepSeek-V4国产化适配测试工作。
同日A股半导体板块全线爆发,覆铜板指数涨5.82%、半导体设备指数涨5.68%。此外DeepSeek在发布后两天内连续两次降价,百万token最低仅2分钱,国产算力商业化前景正被市场重新定价。
更新时间:2026-04-30
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号