中国核聚变再领先!AI模型登顶刊,能力超预期,国际同行难追上

文 | 锐观经纬

编辑 | 锐观经纬

全球都在盯着核聚变这块“清洁能源蛋糕”,谁能先突破稳态运行技术,谁就相当于握住了未来能源的主动权。

最近,中国科研团队又抛出了一个重磅成果。一款叫PaMMA-Net的AI模型登上了核聚变领域顶刊《NuclearFusion》,不仅把磁测量演化预测相似度做到了95%以上,还能直接为托卡马克装置的控制系统“指路”。

要知道,这可是困扰全球聚变界多年的难题,中国这次不仅解决了,还做得比不少国际同行预期的更好。

可问题是,为啥偏偏是中国先突破,这个AI模型到底强在哪,能让国际同行短期内难追上?

想搞懂这个突破的分量,得先看看全球核聚变的“竞速格局”,现在业内基本有个共识:核聚变要走向商业化,得闯过“稳态运行”和“能量增益”两道关。

国际热核聚变实验堆ITER项目就是最典型的例子,汇聚了欧盟、中国、美国、日本、韩国、印度和俄罗斯七方力量,目标很明确。

计划在本世纪30年代实现Q值大于10的聚变能量增益验证,简单说就是产出的能量能达到输入能量的10倍以上,而从商业化时间表来看,行业普遍预计主流托卡马克技术路线会在2035年前后进入聚变堆示范阶段,2050年左右实现商业发电。

但这些目标的前提,是得先搞定“实时控制”,托卡马克装置里的等离子体可不是好“拿捏”的,温度超过一亿摄氏度,再加上强磁场的约束,它的运动呈现出高度复杂的非线性特征。

传统上用的物理模型,虽然能从基本方程出发描述等离子体演化,但面对长时程、多变量的实际控制场景,计算速度和精度根本跟不上,比如要处理毫秒级响应的传感器数据流,传统模型的计算成本能高到让人却步,这也是全球同行都卡壳的地方。

就在大家都在为“实时控制”头疼的时候,中国已经靠硬实力打下了基础,2024年,中国环流三号首次实现离子和电子温度“双亿度”突破,把极端条件下的等离子体控制往前推了一大步。

2025年1月,中国全超导托卡马克装置EAST更创下了1066秒的高约束模等离子体运行世界纪录,这个数字比2023年的403秒记录延长了近1.5倍。

更关键的是,EAST自建成以来累计进行了数万次放电实验,这些海量的真实实验数据,成了后续AI模型研发的“宝藏”,要知道,国际上很多团队要么缺这么大规模的实验数据,要么数据覆盖的工况不够全,这一步中国已经领先了。

有了扎实的装置和数据基础,PaMMA-Net的出现就不是偶然了,这个模型是中国科学技术大学、中科院等离子体物理研究所及科大讯飞研究院联合研发的,核心是基于Transformer架构的深度神经网络代理模型。

和传统物理模型比,它走的是“数据驱动”的路子,但又不是简单堆数据,而是做了很多贴合核聚变物理特性的优化。

研发团队先把实验数据做了细致处理,涵盖了磁感应强度、磁通、等离子体电流、环电压、内感、储能、比压和线圈控制电压等多模态输入输出,再通过频率统一、缺失补全、标准化与序列裁剪等步骤,形成了高质量的训练样本。

模型架构上,他们没用完整的Transformer,而是选择了仅编码器的设计,这样既保留了Transformer处理序列数据的强大能力,又去掉了解码器,大幅降低了推理延迟,刚好满足托卡马克装置毫秒级响应的需求。

更让人眼前一亮的是“微变累计预测”策略,不同于直接预测未来时刻的具体数值,模型会先计算相邻时间步之间的微小变化,再通过累加得出完整的演化轨迹,这个设计可不是拍脑袋想的,而是贴合了电磁传感器的测量特性。

磁场变化本身比较缓慢,相邻时刻的测量值关联性很强,预测变化量比预测绝对值更容易让模型收敛,同时也契合了等离子体物理里“平衡态加扰动”的经典建模思路。

实际测试结果也印证了模型的实力,在包含860次放电记录的独立测试集中,绝大多数放电样本的预测相似度超过90%,部分甚至能达到95%以上,这个精度已经足够支撑下游的控制应用了。

研究团队还做了进一步验证:通过数值求解格拉德-沙弗拉诺夫方程,从模型预测的磁测量数据里恢复等离子体边界形状及关键运行参数,结果显示,不管是放电的上升段、平顶段还是下降段,模型都能准确捕捉等离子体形态的演化。

这说明它不只是在统计上拟合了数据,更真正学到了支配等离子体行为的内在物理规律,这可比单纯“背数据”的模型强多了。

这个能力落到实际应用上,价值一下子就显出来了。最直接的就是把模型变成了“虚拟托卡马克装置”,以前设计控制器,得靠大量真实放电实验调试,每次实验成本高不说,一旦参数设置不当,还可能导致等离子体破裂,损坏装置部件。

2022年DeepMind和瑞士等离子体中心合作时,虽然证明了深度强化学习能在模拟器里训练控制策略,但模拟器毕竟有建模假设,可能和实际情况有偏差。

而PaMMA-Net是从EAST的真实实验数据里学出来的,能为强化学习、模型预测控制等先进算法提供更贴近实际的训练环境,这一步又比国际同行往前多走了一截。

除此之外,模型还能帮着优化放电规划,实验前先用模型快速评估不同加热功率、磁场配置组合下的等离子体响应,筛选出最有希望的参数集合再做实际测试,能大幅降低试错成本。

另外,它还能辅助故障诊断和物理机制识别,如果模型预测和实际测量出现明显偏差,这个偏差可能就暗示了训练数据里没覆盖的新物理现象,或者是设备出了异常,能给科研人员提供很有价值的线索。

更意外的是,这套研发范式已经推广到了空分装置工艺优化、大型建筑制冷能耗管理等工业场景,说明它不是只能用在核聚变领域,跨领域迁移能力也让国际同行很难短时间追上。

当然,中国能在这个领域领先,不只是靠一个模型,更靠背后的“硬支撑”。一方面是长期的实验积累,EAST数万次放电不是一天完成的,这种持续投入带来的数据集,国际上没几个团队能比。

另一方面是“AI+科学”的完整转化链条,从大规模实验数据积累,到算法创新,再到工程验证,每个环节都能衔接上,形成了闭环,这种体系化的能力,不是靠单一团队突击就能建成的,也是国际同行短期内难以复制的核心竞争力。

不过,也得客观看待数据驱动方法的局限。神经网络的“黑箱”特性是个绕不开的问题,哪怕预测再准,也很难直接用它揭示新的物理规律。

而且模型的泛化能力依赖训练数据的覆盖范围,如果遇到训练集中没出现过的极端运行模式,预测可靠性可能会下降。

未来研究还得往这些方向发力,比如把物理知识明确嵌入网络架构,开发可解释性分析工具,或者探索少样本学习方法,应对实验数据稀缺的场景。

但不管怎么说,PaMMA-Net的突破已经让中国在核聚变稳态运行领域站稳了领先位置。它不只是解决了一个技术难题,更证明了AI能深度介入大科学装置研究,为核聚变商业化铺了重要的一块砖。

当“人造太阳”真正点亮清洁能源时代的时候,我们或许会发现,像PaMMA-Net这样的智能控制系统,正是这场能源革命里最关键却又最坚实的基石。

而中国现在已经在这个关键领域走在了前面,未来能给全球核聚变研究带来更多惊喜,也值得期待。

展开阅读全文

更新时间:2025-10-16

标签:科技   中国   模型   同行   能力   国际   等离子体   数据   装置   物理   马克   聚变   团队

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top