震惊！传DeepSeek R2参数暴涨至1.2万亿、便宜97.3%！

起因爆料

4月27日，投资平台“韭研公社”首次披露R2参数细节，随后X平台（原Twitter）用户@iruletheworldmo发布“1.2万亿参数+97.3%成本下降”的爆料。

4月28日，HuggingFaceCEO在推特发布含DeepSeek仓库链接的神秘帖子，进一步引爆猜测。

截至4月28日，DeepSeek官方未正式发布R2，但多个第三方机构通过技术拆解验证了部分参数合理性。

热议传播

这场热议始于4月27日的投资社区“韭研公社”，当“1.2万亿参数+97.3%成本降幅”的词条突然出现，立刻引发技术圈与资本圈的双重震动。紧接着，X平台上知名科技博主的爆料、HuggingFaceCEO的神秘推文，让传闻热度呈指数级攀升。在技术论坛，开发者们围绕“混合专家模型（MoE）如何将万亿参数计算量压缩至百亿级”展开激烈讨论；在资本市场，“华为昇腾概念股”应声大涨，拓维信息等供应链企业单日涨幅突破10%，仿佛提前庆祝国产算力的突围时刻。

支持者们看到了技术突破的曙光。QH大学AI实验室主任LH指出，R2采用的HybridMoE3.0架构通过动态激活机制，让1.2万亿参数的实际计算量降至780亿，这种“密度革命”比单纯堆砌参数更具技术价值。华为昇腾团队则透露，通过全互联集群设计与梯度压缩技术，昇腾910B芯片集群的算力利用率达到82%，首次在硬件效率上逼近英伟达A100水平。这些技术细节让人们相信，国产AI正在突破“卡脖子”困境。

但质疑声同样尖锐。某大厂CTO在公开场合直言，参数规模不等于技术实力，R2的多模态理解能力尚未通过第三方测评，“高幻觉率”和推理延迟问题仍是待解之谜。英伟达则从商业角度泼来冷水，指出昇腾芯片的软件生态成熟度不足，企业迁移成本可能抵消硬件价格优势。这种立场分化，折射出AI产业深层的竞争格局——当开源模型（如Mistral、Llama）以“白菜价”冲击市场，闭源厂商的技术神话需要更扎实的落地数据支撑。

技术暗战

拨开传闻的迷雾，其核心逻辑暗合AI产业的两大趋势：参数效率化与算力国产化。DeepSeek的“1.2万亿参数”并非简单的规模扩张，而是通过MoE架构实现“动态激活”——就像图书馆里只有被借阅的书籍才被翻动，模型中仅7%的参数会在单次计算中被调用，既保持了知识储备的广度，又避免了算力浪费。这种思路与谷歌GLaM、微软MT-NLG等国际顶尖模型异曲同工，证明中国团队已掌握大模型架构创新的核心密码。

更引人注目的是算力国产化的突破。当英伟达H20芯片对华断供成为常态，DeepSeek选择完全搭载华为昇腾910B芯片，单卡成本降至A100的60%，并通过青海的数据中心集群获得20%的电价补贴。这种“硬件自主+政策红利”的组合拳，让训练成本从GPT-4o的2.6美元/百万token暴跌至0.07美元，真正实现了“让大模型训练从‘贵族运动’变为‘大众赛事’”。正如某著名投资人所言：“当算力成本不再是门槛，中小企业的AI创新将迎来黄金时代。”

寻找平衡

这场传闻带来的，远不止是技术层面的讨论，更预示着AI产业生态的重构。若R2属实，首先受冲击的是模型服务市场，DeepSeek若以“成本价”入场，可能引发全行业的价格战，推动AI应用从“头部企业专属”走向“千行百业普惠”。

核心公司

在算力供应链，拓维信息、中科曙光等企业的订单量激增，标志着“昇腾生态”开始打破英伟达的垄断格局，国产算力产业链迎来历史性机遇。

与DeepSeek-R2相关的核心公司主要分布在算力基建、多模态应用、硬件支持、股权关联及数据合作等领域。以下是综合多篇来源梳理的核心企业及其关联逻辑：

一、算力基建与硬件支持

拓维信息（002261）关联逻辑：华为昇腾生态核心代工厂，承接DeepSeek超算中心50%以上基建订单，2025年AI服务器产能预计突破10万台。

中科曙光（603019）关联逻辑：国产液冷服务器龙头，为DeepSeek杭州训练中心提供液冷系统，单机柜功率密度达40kW，能耗成本降低30%。

鸿博股份（002229）关联逻辑：运营华北最大算力节点，储备3000P异构算力，独家承担DeepSeek-R2北方区域推理任务。

浪潮信息（000977）关联逻辑：为DeepSeek提供5000+台混合架构服务器（H800+昇腾910B），部署于北京亦庄智算中心，市占率领先。

寒武纪（688256）关联逻辑：思元590芯片完成DeepSeek框架适配，算力密度提升40%，2025年订单能见度超50亿元。

二、多模态应用与垂直场景合作

东方国信（300166）关联逻辑：联合开发工业大模型，中标宝钢智能炼钢项目，钢铁冶炼能耗下降12%。

科大讯飞（002230）关联逻辑：教育场景接入DeepSeek-Math模型，推出AI数学辅导应用“星火助学”，覆盖全国3万所学校。

拓尔思（300229）关联逻辑：与DeepSeek合作开发金融舆情大模型，已在中信证券部署智能研报生成系统，错误率降低90%。

金山办公（688111）关联逻辑：WPS智能写作集成DeepSeek-Writer API，提升公文生成效率。

三、股权关联与资本纽带

浙江东方（600120）关联逻辑：通过旗下基金参与DeepSeek天使轮投资，创投业务利润贡献占比18%，潜在股权增值空间达20倍。

华金资本（000532）关联逻辑：珠海国资旗下投资平台，参与DeepSeek Pre-A轮融资，受益于粤港澳大湾区政策倾斜。

四、数据与算力生态合作

每日互动（300766）关联逻辑：作为幻方量化二股东，提供超4亿日活设备用户行为数据，牵头浙江大数据计算中心支持算力。

润泽科技（300442）关联逻辑：提供廊坊数据中心3000+机柜资源，采用间接蒸发冷却技术降低运营成本15%。

五、光通信与硬件技术

中际旭创（300308）关联逻辑：800G光模块批量供应DeepSeek北美节点，CPO方案降低能耗35%。

天孚通信（300394）关联逻辑：独家供应光引擎组件，月出货量突破10万只，市占率超60%。

另参考他文内容：

但狂欢之下更需理性。技术层面，R2的实际性能仍需第三方测评机构（如C-Eval2.0）的独立验证，“参数规模”与“工业级可靠性”之间的鸿沟，需要海量真实场景数据来填补；商业层面，企业客户对数据安全的要求（如医疗行业需等保2.0认证）、开源模型的快速迭代（Mistral7B成本仅为GPT-4的1/17），都在考验DeepSeek的商业化落地能力。正如一位AI创业者在朋友圈写道：“我们需要的不是参数神话，而是能解决具体问题的‘接地气’技术。”

无论传闻最终是否坐实，DeepSeek引发的讨论已揭示AI产业的深层变革：从“参数军备竞赛”转向“效率优化”，从“依赖进口算力”转向“自主创新生态”，从“巨头垄断”转向“普惠共享”。这或许才是这场风波带给行业最珍贵的启示——技术突破的意义，不在于制造神话，而在于让先进技术走出“象牙塔”，成为赋能千行百业的工具。

以上内容仅作为参考，不作为投资建议。投资有风险，投资需理性。

展开阅读全文

更新时间：2025-11-28

标签：华为英伟参数逻辑模型生态核心成本便宜数据财经技术

1 2 3 4 5

震惊！传DeepSeek R2参数暴涨至1.2万亿、便宜97.3%！

权属手续“卡脖” 一年，桂林银行上市之路还有多少障碍未扫清？

定好闹钟！德阳政府消费券来了！抢券时间、平台→

总投资额90亿元！“投行投重庆”首场活动成功举行

103家全球服务商为企业出海保驾护航，静安发放“出海服务券”

国家发改委回应美国所谓“对等关税”：害人害己不得人心，必将以失败告终

爆剧专业户任嘉伦，为啥总被说“扑街”？内娱迷惑大赏

丁真携手新疆大美女演白蛇传，迟迟难入戏，当场惹怒曾志伟引热议

佟大为老婆关悦的脸好吓人，肿成了奶白馒头，脸上打了多少针呀？

虞书欣双马尾超可爱

金晨身上多处纹身被吐槽：鼻子奇怪连呼吸都困难

体操女神何傲儿：退役后被亲爹送给75岁富商，因劈腿小鲜肉被控诉

“凤凰传奇”曾毅主演电影即将上映，玲花为啥却不开心？

沈亨倬提及金希澈与平井桃的昔日恋情

兢兢业业！哈滕25分钟7中5贡献11分12板3助4断正负值+8全队最高

主场险胜！勇士104-93火箭，谁是本场的功臣，数据不会说谎

贸促会谈英伟达黄仁勋访华：中国的确定性是不确定世界的

商务部：降低外贸企业内销成本推动减免房屋租金、展位

摩尔线程智能申请缓存技术专利，提供支持更大请求粒度的

小米YU7续航835km封神？智驾短板恐难敌华为系众将

自己做虾饺真的太好吃太便宜

航天科技集团质量技术部部长严泽想升任集团副总经理

今日A股有望迎来反弹，预计下午收盘或上涨12点核心逻辑

鸿蒙生态：国产科技发展的新生命与未来期待