AI大模型发现了人类从未想到的纳什均衡算法，中国团队取得新突破

AI真的能超越人类顶级数学家？北大前沿计算研究中心的团队刚干了一件让整个理论计算机界震动的事——他们把大语言模型和自动数学证明系统绑在一起，搞出了一个叫LegoNE的框架，在近似纳什均衡这个人类钻研了几十年的方向上，第一次让机器发现了超越所有已知人类设计范式的新算法！这事儿到底有多牛？又藏着多少争议？

要理解这个突破的分量，得先搞懂纳什均衡近似算法有多难。寻找两人博弈的纳什均衡，是PPAD完全问题，三人博弈也一样——这意味着在最坏情况下，没有已知的多项式时间精确解法。学术界只能退而求其次，找近似比尽可能小的ε-ANE算法。两人博弈方向上，近似比从3/4一路降到1/2、0.38、0.36，最后在2007年被Tsaknakis和Spirakis做到了0.3393，也就是TS算法。这个数字，十几年里没人能再往下推哪怕一点点。三人博弈更惨，人类之前的最佳近似比是0.6+δ，卡在那儿动不了。

LegoNE的思路很绝——先用类似Python的领域专用语言，把任意候选算法翻译成有约束的优化问题。求解这个问题，就等于自动推导并证明算法的近似上界。简单说，“算”和“证”被合二为一了：LLM负责创造性组合算法构件，LegoNE分析器负责瞬间给出严格的理论反馈。实验里，研究者只给DeepSeek-R1提供2007年之前的算法构件，两轮交互后，模型居然重新发现了和TS算法等价的两人博弈最优解——而人类完成这一步花了15年！更炸裂的是三人博弈：团队用LegoNE设计出的新算法，把近似比从0.6+δ直接压到了0.5+δ，这可是人类从未触及的区间！

AI真的“发现”了新算法？还是人类给它搭好了积木？

但别忙着吹AI神化——论文作者自己都在文中坦言，这套方法有个大局限：高度依赖人类专家事先构造好的领域语言。AI能探索的算法空间，是人类先帮它框定好的。换句话说，AI在LegoNE里就像玩积木，积木块都是人类给的，它只是把积木搭出了新花样。这并不否定它的价值，但也提醒我们：别过度脑补“AI独立做数学”的浪漫故事。

这个进展为什么值得认真对待？它可不只是刷了个理论指标。过去几年AI在数学上的成绩，大多是“解题”层面——比如做奥数题、证明定理的具体步骤、解特定实例。但“发现具有可证明保证的一般性算法”，一直是公认的高墙。因为这要求AI不仅给出方案，还要保证方案在所有可能输入下都成立，而这恰恰是LLM最容易出错的地方。LegoNE的解法是把验证外包给可证明正确的符号系统，让LLM在有“硬质量保证”的沙盒里探索。这种“人类设定构件库、AI组合爆搜、形式化引擎实时打分”的分工，正在成为AI和理论科学结合的范式雏形。

国际上也有类似方向的对照。谷歌DeepMind的AlphaProof、AlphaGeometry拿了奥数金牌，FunSearch用LLM加进化搜索找到了组合数学的新构造。但LegoNE不一样——它直面的是“算法设计”，不是“问题求解”，而且证明保证是面向所有输入的，不是某个具体实例。这个差别在理论计算机社群里，被认为是相当关键的一步。

更重要的是，这套方法原则上能迁移到博弈论之外的领域。只要某个问题能被压缩进可计算、可证明的小型符号空间，“人类抽象、AI组合、机器验证”的三段式就可能复用。调度、近似算法、在线学习的regret分析，都是可能的下一站。但这件事能走多远，取决于一个不浪漫的现实：构造像LegoNE这样既严格又有足够表达力的领域语言，需要顶尖人类专家投入数年。

这个突破，到底是革命还是工具延伸？

AI在其中的角色，更像一个有惊人耐心和算力的青年研究者，而不是自己定义数学的造物主。但对人类研究者来说，多一个能在十几年没人推动的近似比上压下一截的合作者，已经足够有价值了。不过问题来了：你觉得，AI在数学领域的角色，到底是平等的“合作者”，还是只是人类智慧的“工具人”？这个突破，是真正的革命，还是人类给AI搭好积木后的一次精彩组合？这事你怎么看？

相关论文已于2025年8月发布在arXiv（编号2508.11874），更早的会议版本则发表在WINE 2024（《Web and Internet Economics》会议）。不管争议如何，这个框架确实给AI和理论科学的结合打开了新的可能性——只是我们得清醒地看到，AI的每一步“突破”，背后都离不开人类智慧的托底。你会为这个进展感到兴奋吗？还是觉得它离真正的“AI做数学”还有很长的路要走？

展开阅读全文

更新时间：2026-06-22

标签：科技中国算法模型团队人类近似组合积木数学理论领域研究者构件

1 2 3 4 5

AI大模型发现了人类从未想到的纳什均衡算法，中国团队取得新突破

AI真的“发现”了新算法？还是人类给它搭好了积木？

这个突破，到底是革命还是工具延伸？

2027年，如果房价继续下跌，中国50%的家庭或将面临3个大麻烦

马云预言成真？2026年，手握存款的人，也许将面临“三大挑战”

从300元到34元，通策医疗与胜宏科技，两种不同的市场定价逻辑

特朗普：要不是我轰炸伊朗核设施，以色列早没了；奥巴马以为能用钱收买伊朗，给了上百亿美元，根本没用

当丹麦靠几家企业躺赢时，世界才发现：14亿人的中国没有第二条路

特朗普的“枪”哑火了？100多家中企上黑名单：一看枪口对准自己

传递微光致敬每一位星星的翻译官

夏天带娃出门，防蚊路上，拒绝错误操作

搭乘科普直通车入园童心探秘昆虫守护绿色家园

备孕人群怎么选辅酶Q10？2026好物盘点，备孕人群适合什么牌子？

教育孩子真有技巧，爷爷用他的智慧，教会孙子洗抹布，爷孙都笑了

董卿也没想到，曾和自己相恋6年的程前，已走上另一条“上坡路”

明明是“半吊子”，还敢装资深导师，《歌手》撕碎了这两位的体面

深夜救人获官方表彰，张颂文藏了半年的善举，终于藏不住了

32岁章泽天疯玩海洋球，楼梯干饭少女感爆棚，近看已然不再青涩

2027年，如果房价继续下跌，中国50%的家庭或将面临3个大麻

从300元到34元，通策医疗与胜宏科技，两种不同的市场定价

当丹麦靠几家企业躺赢时，世界才发现：14亿人的中国没有第

2026世界杯乱成一锅粥！球迷集体喊话中国接办，这届办得实

中国Token工厂，又融资20亿

让科技的种子落地生花（活力中国调研行）

欧美算盘落空，中国迎来两大关键筹码，C919即将更换“中国

德国总理站出来，呼吁27国联手，用美国搞垮日本那套，来对付

历史要毁于一旦？已经独立百年的蒙古，正把中国40年的努力

中国造纸学会就纸尿裤事件声明：涉事企业产品合规，市面在