70亿人干10年!刚登顶仅24小时,美国就急眼封锁:中国早有破壁刀

2026年6月23日,在德国汉堡的国际超算大会现场,最新一期TOP500榜单揭晓的那一刻,全场安静了好几秒。

排在榜首的不是美国那台霸榜快两年的“酋长岩”(El Capitan),而是一台来自中国深圳、名叫“灵晟”的机器。2.198EFlops(HPL实测Rmax),每秒219.8亿亿次浮点运算。

1秒钟的计算量,相当于全球70亿人每秒完成1次计算,昼夜不停算上10年。

上一次中国超算排第一的是2017年的“神威·太湖之光”。九年里,美国对华芯片制裁一轮接一轮,高端GPU禁售,先进制程封锁,HBM高带宽内存断供。行业里普遍的看法很简单:能稳住第二梯队就不错了。

图源网络 “神威·太湖之光”超级计算机

但“灵晟”不靠任何一张美国GPU,纯CPU架构,跑出了世界第一。不仅世界第一,还是全球首台HPL实测性能突破2EFlops门槛的超算,比第二名美国El Capitan快了整整21.5%。

说实话,看到这个新闻,我真的是又激动又困惑。不是困惑它凭什么赢,是困惑一件事:封锁九年,怎么反而封出一个世界第一?

这不是被封锁拖垮了,是被封锁逼出了一条新路。

先别急着鼓掌,这条新路背后的逻辑,比“中国赢了”四个字复杂得多。

封锁九年逼出世界第一

如果你这几年翻过TOP500榜单,大概率有个印象:中国超算不行了。到2025年,“神威·太湖之光”排到了第21名,“天河二号A”落到了第31名。外媒的标题都没什么悬念:中国超算时代终结。

但这份榜单测的不是能力,是公开提交的跑分。而中国在2017年神威霸榜之后,再未提交新研制的顶级超算系统参与排名。不提交的原因也不复杂,2019年美国升级HPC芯片出口管制、扩大实体清单制裁范围后,继续拿国产超算去跑分等于告诉别人:你看,我们又突破了。

没人知道这九年里中国超算到底在干什么。直到6月23日,灵晟把跑分交了出来。

图源网络 “灵晟”超级计算机

从2017年的93PFlops,到2026年的2198PFlops。性能达到了九年前神威·太湖之光的23.6倍,实际性能提升了22.6倍。同期美国最快的系统El Capitan是1.809EFlops。灵晟比它快了21.5%。

这个数据其实挺反常识的。封锁的目的是让你用不到最先进的东西,结果你不仅用了,还做得比封锁你的人更快。图灵奖得主、TOP500联合创始人杰克·唐加拉在现场评价称:“中国的灵晟系统让世界看到了超算通向科学智能(AI for Science)新型系统架构的希望之光。”

说白了,制裁的目的从来不是“不让你用”,而是“不让你自己做”。但灵晟恰恰证明了:你不给的,我做得更好。

不过,赢是赢了,赢的方式比赢这件事本身更有意思。

2026年6月全球TOP500超算HPL实测性能排名(前五) 数据来源:TOP500官网 ISC2026

技术路线豪赌:纯CPU凭什么赢了GPU

灵晟用的不是全球主流的CPU加GPU异构架构,而是纯CPU路线。说白了,全世界都在往超算里塞GPU,灵晟反其道而行之,一张GPU都没用。

这不是买不到GPU才用CPU,是换了一条更聪明的路。

全球TOP500超算里搭载GPU加速卡的异构系统占比过半,美国三台E级超算El Capitan、Frontier、Aurora全部走CPU加GPU路线。这条路的逻辑很直白:GPU擅长并行计算,把大量浮点运算交给GPU,CPU做调度,分工合作,效率高。

但灵晟的设计团队走的是另一条思路:如果数据在CPU和GPU之间搬运本身就耗时间耗功耗,那把加速单元直接做进CPU里不就行了?

于是有了LX2处理器。基于ARMv9架构,由国内团队深度定制设计,1.55GHz主频,每颗CPU嵌入AI矩阵加速单元,集成国产自研HBM高带宽内存,内存带宽比传统CPU配套内存提升了10倍。全系统20480个计算节点,约1379万个CPU核心,自研灵启高速互联网络,每节点带宽1.6Tb/s,首创100%全液冷散热计算机柜,能效比达到51GFlops/W。

这套架构一次性解决了两个问题:既绕开了GPU禁售,又省掉了CPU和GPU之间数据搬运的开销。大规模并行环境下的平均扩展效率做到了84.4%。这个数字翻译过来就是:不是只能跑测试拿高分,是真正能在实战里撑起大规模科学计算。

灵晟超算系统总设计师卢宇彤总结得很到位:这“不是被动选择,而是主动换道。”

但更让人在意的,不是灵晟的技术参数,是这台机器背后那条产业链。

图源网络 深圳市光明区的国家超级计算深圳中心

产业链全景:国产产业链集体亮相

灵晟不是某个公司单打独斗的产品,是中国芯片、服务器、网络、散热、软件一整条国产供应链的集体证明书。

核心芯片是国产自研的LX2处理器。从参数上看,基于ARMv9架构,304核心,内嵌AI矩阵加速。这颗芯片的背后,是整个国产芯片设计能力的一次集中亮相。

液冷整套机柜、配套服务器硬件由中科曙光供货。国内半数国家级超算中心都是曙光承建。100%全液冷这个技术方案,比排名本身更具商业想象空间,液冷不是超算专用技术,它可以迁移到任何一座数据中心。换句话说,灵晟无意间给国产液冷方案做了一张含金量极高的认证。

服务器整机是浪潮信息出的。浪潮的液冷服务器市占率已经是国内第一。国产交换芯片盛科通信、高速光模块新易盛和光迅科技,都在灵晟的20480个节点里拿到了实战验证。

图源网络

6月23日灵晟登顶的消息传回国内当天,A股算力板块并未立刻响应,当天中科曙光跌2.2%,浪潮信息跌3.32%,大盘整体下探。但经过两天的消化和发酵,6月25日,算力板块迎来爆发:中科曙光放量涨停,报收97.82元,单日成交约125亿元,主力净流入约23亿元;浪潮信息大涨5.82%,光模块、液冷、服务器概念全线走强。

但涨停板是情绪的,订单是慢的。灵晟最大的价值不在于这台机器喂饱了几只股票,而在于它把国产算力方案从“够不够资格”的讨论,变成了“什么时候下单”的讨论。

从零到一的证明已经有了。但从一到一百的订单,不会在一个月内兑现。国内大型E级超算中心整体建设交付周期普遍三到五年,订单释放是线性的,不是爆发的。别把涨停板当业绩预告。

那问题来了:一台世界最快的超算,到底值多少钱?

这个问题听起来市侩,但它是中国超算从国家工程走向商业引擎必须回答的。

从跑分到跑应用:第一名的真实含金量

超算创造的经济价值是间接的。天气预报更准了,灾害损失就少了。新药筛选更快了,药企研发成本就降了。材料模拟更好了,制造业工艺就提升了。

灵晟已经在药物筛选上,依托自研AI矩阵加速单元,在特定小分子化合物库虚拟筛选场景下,实现单日十万亿级化合物筛选,配套AI强化学习算法后筛选效率提升千倍;在遥感影像上实现了全球八年时序数据的高倍压缩与重建。这些产出直接影响的是制药、气象、国土监测这些万亿级产业。

但超算本身的商业模式一直是个问题。建造成本动辄数十亿上百亿,运营靠财政拨款,服务定价难,科研用户付费能力有限,企业用户更习惯用云端的AI算力而不是排队申请超算机时。

灵晟全CPU架构关键技术参数 数据来源:ISC2026 新华网

这就是灵晟登顶背后那个有点尴尬的现实:它拿了含金量最高的金牌,但这枚金牌挂上墙之后,怎么变现,还没有标准答案。

其实放眼全球,超算的商业化都是个难题。美国的El Capitan主要拿来做核武器模拟,前沿计算的主要用户是国家实验室。区别在于,美国有微软、谷歌、亚马逊这些云巨头在商业算力市场挑大梁,超算只管“国家队”的活。而中国的商业算力市场还在追赶期,阿里云、华为云在全球还是第二梯队。超算拿了世界第一,但AI算力的大头,仍然在微软谷歌的手里。

不是超算不重要了,是单靠超算已经不够了。

那美国下一步会封什么?灵晟登顶不到24小时,美国就出现了管制CPU指令集的声音。ARM、x86、RISC-V,可能都会进入管制清单。

窗口期与下一张牌:美国下一步封什么

但这条路大概率堵不死。华为有自研多年的灵犀指令集备胎,龙芯有自己的LoongArch(龙架构)指令集,国内多家企业持有ARMv9长期商用架构授权。说白了,美国每封一个东西,中国就造一个替代品出来。九年封锁史已经证明了这一点。

图源网络

真正的挑战不在这一代。全CPU路线赢下了这一仗,但下一代超算的路线图是什么?量子计算如果实用化突破,传统超算的护城河能守多久?这才是灵晟登顶之后真正该问的问题。

九年前“神威·太湖之光”登顶的时候,没人想到接下来会是九年的封锁。九年后“灵晟”登顶了,同样没人能预测下一个九年会发生什么。

但有一点跟九年前不一样了。那一次登顶,靠的是一颗申威芯片的单点突破。这一次,是靠从芯片到网络到散热到软件的一整条国产供应链。

超算第一只是一张成绩单,真正被验证的,是这张成绩单背后那条路。

展开阅读全文

更新时间:2026-07-02

标签:科技   美国   中国   小时   太湖   架构   芯片   神威   曙光   全球   网络   系统

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号

Top