AI圈吹牛皮成风?这家中国公司偏不!发布新模型直接说“我比GPT落后3-6个月”,却让全球同行刮目相看?
大多数AI公司发新模型,都会挑自己能赢的测试,然后喊“业界领先”。但DeepSeek在2026年4月24日发布V4-Pro和V4-Flash时,技术报告里写了句罕见的实话:V4-Pro-Max“略逊于GPT-5.4和Gemini-3.1-Pro,发展轨迹落后约3到6个月”。
在充斥着自我吹嘘的行业里,这种坦诚本身就是新闻。3到6个月在AI圈意味着什么?前沿模型迭代快到“日新月异”,OpenAI、谷歌半年前的顶尖水平,现在就是DeepSeek的旗舰。这不是难堪,而是信号——他们的技术已经摸到了全球第一梯队的门槛。
更有意思的是,DeepSeek的坦诚是选择性的:能赢的地方亮数据,输了的主动认账。编程能力上,Codeforces评分3206,超GPT-5.4的3168和Gemini的3052,LiveCodeBench得分93.5更是傲视同侪;数学推理IMOAnswerBench89.8分、HMMT2026测试95.2分,相当能打。但世界知识领域,SimpleQA-Verified仅57.9分,比Gemini的75.6差了近18个点,他们直接承认“丰富世界知识方面落后”。Fortune杂志说,这种不回避的态度,反而让他们的技术报告在业界更受信任。
聊DeepSeek的性能,绕不开硬件困境。美国对华出口管制卡着最先进AI芯片,DeepSeek只有约5万块英伟达H100,和OpenAI、谷歌的几十万块根本不在一个量级。但英伟达CEO黄仁勋却称他们是“全球领先的开放模型公司”——话里有话:在受限条件下,DeepSeek的效率太惊人。
V4-Pro用了混合专家模型(MoE),总参数量1万亿,但激活参数仅370亿,推理成本直接降下来。更关键的是,它是首批针对非英伟达硬件优化的前沿模型,甚至能在华为昇腾芯片上高效运行——这明显是在为更严的管制做准备。
价格更是刺眼:V4-Pro-Max的API调用,每百万输入token1.74美元,输出3.48美元,比GPT-5.4便宜8倍,比Claude Sonnet4.6便宜10倍,输出端差距达20-30倍。对企业开发者来说,这个价差足以改变选型决策。VentureBeat分析得准:“以1/6的成本实现接近最顶尖的智能”,这就是DeepSeek最狠的商业牌。
在AI落地最快的智能体任务上,DeepSeek已经追平甚至反超。SWE-Verified测试中,V4-Pro-Max得分80.6,和Claude Opus4.6的80.8、Gemini的80.6几乎持平;工具调用能力测试Toolathlon上,更是超越了两者。这意味着,在代码生成、自动化这些企业最需要的场景里,DeepSeek已经和全球顶尖选手站在同一条起跑线。
更宏观的是,DeepSeek不是孤军奋战。阿里巴巴Qwen系列全球下载超7亿次,Moonshot AI的Kimi K2持续推进开源边界,整个中国AI生态正在系统性扩张全球影响力。DeepSeek的V4版本,是这场浪潮里的一朵浪头,不是偶然的水花。
落后3-6个月又怎样?这个差距正在肉眼可见地收窄。中国AI企业在芯片受限的情况下,用效率和价格打出了自己的路。你觉得未来1年,中国AI能追上甚至反超全球顶尖水平吗?评论区聊聊你的看法,看看大家都怎么想!
更新时间:2026-04-30
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号