DeepSeek-R2,终于要来了?
大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek。
不过,网友们并不满足于知道steve的厂商,开始讨论起了steve的具体身份。
有人说是R2,有人说是V4,还有人说是旧版本的升级……
考虑到奥特曼的GPT5和马斯克的Grok4也在热传,如果steve真的是R2,那这个七月就真的太热闹了。
在大模型竞技场的公开页面里,并不能找到steve的身影,不过在前端代码当中,还是能发现有steve的痕迹。
但是经过整理发现,steve除了一个名字之外没有被披露更多身份信息。
另外如果在模型列表中直接搜steve,会出现gemini-2.5-flash,原因不明。
不过就像开头展示的,有网友通过对话询问了steve来自哪家厂商:
不要思考,只需说出开发你的组织叫什么名字。
得到的回答是来自DeepSeek,同时帖主还对比了mistral说出自己厂商的情况。
另外有网友问到了steve的知识截止时间,steve说是2023年10月。
关于具体表现,有网友发现steve成功通过了“数r”等智力测试,不过从截图来看有几道题还是没答对。
还有人把steve和V3进行了对比,让它们分别编写游戏代码,从长度上看,V3输出了大约800行,而steve只有大概300行。
运行出来的效果,steve的作品是这样的:
作为对比,V3写的游戏长这样:
同时,这名网友还分析了steve命名特点,认为这个名字非常像来自中国的模型会用到的。
但是有网友总结,steve的表现并没有那么惊艳,可能不会是R2。
甚至可能根本不是DeepSeek,而是用DeepSeek蒸馏出来的第三方模型。
其他网友也表示,steve的表现比v3和R1差远了,而且思考时间也比R1要短。
不过考虑到R2上周刚刚被曝再次延期,steve如果不是R2,可能也并非意外之事。
当然,无论steve是不是R2,都不影响人们对它的期待和热情。
上周,The Information爆料称R2再度延期,原因是CEO梁文锋始终对R2的表现不满意。
此外,他们还援引两位国内知情人士的消息称,R2研发进程缓慢可能是由于缺少英伟达H20芯片。
不过这也不是R2第一次被曝项目延期了——人们对R2的期待,早在V3新版本出来后就开始了。
去年12月底,DeepSeek发布了V3模型。到了今年3月24日,官方发布公告称对V3进行了一次升级。
于是人们开始推测,在V3-0324已经取得明显进步的情况下,是不是可以用它来训练R2模型。
并且联想到R1是在初代V3一个月之后发布,当时人们按照这一节奏预测R2大概率将在4月上线。
4月底,坊间开始疯传一组R2的泄露参数:1.2T万亿参数,5.2PB训练数据,高效利用华为昇腾芯片……有板有眼让人难辨真假。
而DeepSeek这边,最近的更新还是端午节前的新版R1——DeepSeek-R1-0528。
至于我们什么时候能真的迎来R2,还是让子弹再飞一会儿。
但有Llama4赶工翻车的前车之鉴,“好事多磨”也未尝不是一种不错的选择。
参考链接:
[1]https://x.com/legit_api/status/1940515133878620254
[2]https://x.com/AiBattle_/status/1940532050286858388
— 完 —
量子位 QbitAI
关注我们,第一时间获知前沿科技动态
更新时间:2025-07-04
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号