起因爆料
4月27日,投资平台“韭研公社”首次披露R2参数细节,随后X平台(原Twitter)用户@iruletheworldmo发布“1.2万亿参数+97.3%成本下降”的爆料。
4月28日,HuggingFaceCEO在推特发布含DeepSeek仓库链接的神秘帖子,进一步引爆猜测。
截至4月28日,DeepSeek官方未正式发布R2,但多个第三方机构通过技术拆解验证了部分参数合理性。
热议传播
这场热议始于4月27日的投资社区“韭研公社”,当“1.2万亿参数+97.3%成本降幅”的词条突然出现,立刻引发技术圈与资本圈的双重震动。紧接着,X平台上知名科技博主的爆料、HuggingFaceCEO的神秘推文,让传闻热度呈指数级攀升。在技术论坛,开发者们围绕“混合专家模型(MoE)如何将万亿参数计算量压缩至百亿级”展开激烈讨论;在资本市场,“华为昇腾概念股”应声大涨,拓维信息等供应链企业单日涨幅突破10%,仿佛提前庆祝国产算力的突围时刻。
支持者们看到了技术突破的曙光。QH大学AI实验室主任LH指出,R2采用的HybridMoE3.0架构通过动态激活机制,让1.2万亿参数的实际计算量降至780亿,这种“密度革命”比单纯堆砌参数更具技术价值。华为昇腾团队则透露,通过全互联集群设计与梯度压缩技术,昇腾910B芯片集群的算力利用率达到82%,首次在硬件效率上逼近英伟达A100水平。这些技术细节让人们相信,国产AI正在突破“卡脖子”困境。
但质疑声同样尖锐。某大厂CTO在公开场合直言,参数规模不等于技术实力,R2的多模态理解能力尚未通过第三方测评,“高幻觉率”和推理延迟问题仍是待解之谜。英伟达则从商业角度泼来冷水,指出昇腾芯片的软件生态成熟度不足,企业迁移成本可能抵消硬件价格优势。这种立场分化,折射出AI产业深层的竞争格局——当开源模型(如Mistral、Llama)以“白菜价”冲击市场,闭源厂商的技术神话需要更扎实的落地数据支撑。
技术暗战
拨开传闻的迷雾,其核心逻辑暗合AI产业的两大趋势:参数效率化与算力国产化。DeepSeek的“1.2万亿参数”并非简单的规模扩张,而是通过MoE架构实现“动态激活”——就像图书馆里只有被借阅的书籍才被翻动,模型中仅7%的参数会在单次计算中被调用,既保持了知识储备的广度,又避免了算力浪费。这种思路与谷歌GLaM、微软MT-NLG等国际顶尖模型异曲同工,证明中国团队已掌握大模型架构创新的核心密码。
更引人注目的是算力国产化的突破。当英伟达H20芯片对华断供成为常态,DeepSeek选择完全搭载华为昇腾910B芯片,单卡成本降至A100的60%,并通过青海的数据中心集群获得20%的电价补贴。这种“硬件自主+政策红利”的组合拳,让训练成本从GPT-4o的2.6美元/百万token暴跌至0.07美元,真正实现了“让大模型训练从‘贵族运动’变为‘大众赛事’”。正如某著名投资人所言:“当算力成本不再是门槛,中小企业的AI创新将迎来黄金时代。”
寻找平衡
这场传闻带来的,远不止是技术层面的讨论,更预示着AI产业生态的重构。若R2属实,首先受冲击的是模型服务市场,DeepSeek若以“成本价”入场,可能引发全行业的价格战,推动AI应用从“头部企业专属”走向“千行百业普惠”。
核心公司
在算力供应链,拓维信息、中科曙光等企业的订单量激增,标志着“昇腾生态”开始打破英伟达的垄断格局,国产算力产业链迎来历史性机遇。
与DeepSeek-R2相关的核心公司主要分布在算力基建、多模态应用、硬件支持、股权关联及数据合作等领域。以下是综合多篇来源梳理的核心企业及其关联逻辑:
一、算力基建与硬件支持
拓维信息(002261)关联逻辑:华为昇腾生态核心代工厂,承接DeepSeek超算中心50%以上基建订单,2025年AI服务器产能预计突破10万台。
中科曙光(603019)关联逻辑:国产液冷服务器龙头,为DeepSeek杭州训练中心提供液冷系统,单机柜功率密度达40kW,能耗成本降低30%。
鸿博股份(002229)关联逻辑:运营华北最大算力节点,储备3000P异构算力,独家承担DeepSeek-R2北方区域推理任务。
浪潮信息(000977)关联逻辑:为DeepSeek提供5000+台混合架构服务器(H800+昇腾910B),部署于北京亦庄智算中心,市占率领先。
寒武纪(688256)关联逻辑:思元590芯片完成DeepSeek框架适配,算力密度提升40%,2025年订单能见度超50亿元。
二、多模态应用与垂直场景合作
东方国信(300166)关联逻辑:联合开发工业大模型,中标宝钢智能炼钢项目,钢铁冶炼能耗下降12%。
科大讯飞(002230)关联逻辑:教育场景接入DeepSeek-Math模型,推出AI数学辅导应用“星火助学”,覆盖全国3万所学校。
拓尔思(300229)关联逻辑:与DeepSeek合作开发金融舆情大模型,已在中信证券部署智能研报生成系统,错误率降低90%。
金山办公(688111)关联逻辑:WPS智能写作集成DeepSeek-Writer API,提升公文生成效率。
三、股权关联与资本纽带
浙江东方(600120)关联逻辑:通过旗下基金参与DeepSeek天使轮投资,创投业务利润贡献占比18%,潜在股权增值空间达20倍。
华金资本(000532)关联逻辑:珠海国资旗下投资平台,参与DeepSeek Pre-A轮融资,受益于粤港澳大湾区政策倾斜。
四、数据与算力生态合作
每日互动(300766)关联逻辑:作为幻方量化二股东,提供超4亿日活设备用户行为数据,牵头浙江大数据计算中心支持算力。
润泽科技(300442)关联逻辑:提供廊坊数据中心3000+机柜资源,采用间接蒸发冷却技术降低运营成本15%。
五、光通信与硬件技术
中际旭创(300308)关联逻辑:800G光模块批量供应DeepSeek北美节点,CPO方案降低能耗35%。
天孚通信(300394)关联逻辑:独家供应光引擎组件,月出货量突破10万只,市占率超60%。
另参考他文内容:
但狂欢之下更需理性。技术层面,R2的实际性能仍需第三方测评机构(如C-Eval2.0)的独立验证,“参数规模”与“工业级可靠性”之间的鸿沟,需要海量真实场景数据来填补;商业层面,企业客户对数据安全的要求(如医疗行业需等保2.0认证)、开源模型的快速迭代(Mistral7B成本仅为GPT-4的1/17),都在考验DeepSeek的商业化落地能力。正如一位AI创业者在朋友圈写道:“我们需要的不是参数神话,而是能解决具体问题的‘接地气’技术。”
无论传闻最终是否坐实,DeepSeek引发的讨论已揭示AI产业的深层变革:从“参数军备竞赛”转向“效率优化”,从“依赖进口算力”转向“自主创新生态”,从“巨头垄断”转向“普惠共享”。这或许才是这场风波带给行业最珍贵的启示——技术突破的意义,不在于制造神话,而在于让先进技术走出“象牙塔”,成为赋能千行百业的工具。
以上内容仅作为参考,不作为投资建议。投资有风险,投资需理性。
更新时间:2025-04-29
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号