AI真的能超越人类顶级数学家?北大前沿计算研究中心的团队刚干了一件让整个理论计算机界震动的事——他们把大语言模型和自动数学证明系统绑在一起,搞出了一个叫LegoNE的框架,在近似纳什均衡这个人类钻研了几十年的方向上,第一次让机器发现了超越所有已知人类设计范式的新算法!这事儿到底有多牛?又藏着多少争议?
要理解这个突破的分量,得先搞懂纳什均衡近似算法有多难。寻找两人博弈的纳什均衡,是PPAD完全问题,三人博弈也一样——这意味着在最坏情况下,没有已知的多项式时间精确解法。学术界只能退而求其次,找近似比尽可能小的ε-ANE算法。两人博弈方向上,近似比从3/4一路降到1/2、0.38、0.36,最后在2007年被Tsaknakis和Spirakis做到了0.3393,也就是TS算法。这个数字,十几年里没人能再往下推哪怕一点点。三人博弈更惨,人类之前的最佳近似比是0.6+δ,卡在那儿动不了。
LegoNE的思路很绝——先用类似Python的领域专用语言,把任意候选算法翻译成有约束的优化问题。求解这个问题,就等于自动推导并证明算法的近似上界。简单说,“算”和“证”被合二为一了:LLM负责创造性组合算法构件,LegoNE分析器负责瞬间给出严格的理论反馈。实验里,研究者只给DeepSeek-R1提供2007年之前的算法构件,两轮交互后,模型居然重新发现了和TS算法等价的两人博弈最优解——而人类完成这一步花了15年!更炸裂的是三人博弈:团队用LegoNE设计出的新算法,把近似比从0.6+δ直接压到了0.5+δ,这可是人类从未触及的区间!

但别忙着吹AI神化——论文作者自己都在文中坦言,这套方法有个大局限:高度依赖人类专家事先构造好的领域语言。AI能探索的算法空间,是人类先帮它框定好的。换句话说,AI在LegoNE里就像玩积木,积木块都是人类给的,它只是把积木搭出了新花样。这并不否定它的价值,但也提醒我们:别过度脑补“AI独立做数学”的浪漫故事。
这个进展为什么值得认真对待?它可不只是刷了个理论指标。过去几年AI在数学上的成绩,大多是“解题”层面——比如做奥数题、证明定理的具体步骤、解特定实例。但“发现具有可证明保证的一般性算法”,一直是公认的高墙。因为这要求AI不仅给出方案,还要保证方案在所有可能输入下都成立,而这恰恰是LLM最容易出错的地方。LegoNE的解法是把验证外包给可证明正确的符号系统,让LLM在有“硬质量保证”的沙盒里探索。这种“人类设定构件库、AI组合爆搜、形式化引擎实时打分”的分工,正在成为AI和理论科学结合的范式雏形。
国际上也有类似方向的对照。谷歌DeepMind的AlphaProof、AlphaGeometry拿了奥数金牌,FunSearch用LLM加进化搜索找到了组合数学的新构造。但LegoNE不一样——它直面的是“算法设计”,不是“问题求解”,而且证明保证是面向所有输入的,不是某个具体实例。这个差别在理论计算机社群里,被认为是相当关键的一步。
更重要的是,这套方法原则上能迁移到博弈论之外的领域。只要某个问题能被压缩进可计算、可证明的小型符号空间,“人类抽象、AI组合、机器验证”的三段式就可能复用。调度、近似算法、在线学习的regret分析,都是可能的下一站。但这件事能走多远,取决于一个不浪漫的现实:构造像LegoNE这样既严格又有足够表达力的领域语言,需要顶尖人类专家投入数年。
AI在其中的角色,更像一个有惊人耐心和算力的青年研究者,而不是自己定义数学的造物主。但对人类研究者来说,多一个能在十几年没人推动的近似比上压下一截的合作者,已经足够有价值了。不过问题来了:你觉得,AI在数学领域的角色,到底是平等的“合作者”,还是只是人类智慧的“工具人”?这个突破,是真正的革命,还是人类给AI搭好积木后的一次精彩组合?这事你怎么看?
相关论文已于2025年8月发布在arXiv(编号2508.11874),更早的会议版本则发表在WINE 2024(《Web and Internet Economics》会议)。不管争议如何,这个框架确实给AI和理论科学的结合打开了新的可能性——只是我们得清醒地看到,AI的每一步“突破”,背后都离不开人类智慧的托底。你会为这个进展感到兴奋吗?还是觉得它离真正的“AI做数学”还有很长的路要走?
更新时间:2026-06-22
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号