千万年薪大佬出手！小米这波操作，治好了大模型的“精神分裂”

在阅读文章前，辛苦您点下“关注”，方便讨论和分享。作者定会不负众望，按时按量创作出更优质的内容

文 |昕昕

前言

AI圈又出大瓜+硬核成果双buff事件！

先给不明觉厉的宝子们划重点：那个被雷军砸千万年薪抢的95后"天才少女"罗福莉，带着小米和北大搞出了篇大论文，直接给AI模型的"训练崩溃症"开了副特效药。

AI大神的贡献

先唠唠这事儿的前情提要：去年年底罗福莉凭一己之力冲上热搜，毕竟“千万年薪挖AI大神”这剧本比爽文还刺激。

虽然小米和她本人至今没官宣"入职成功"，但这篇论文里她挂了通讯作者，这波操作懂的都懂——妥妥的"虽未官宣，但已上岗"，雷军这钱花得明明白白。

咱再说说这篇论文到底解决了啥世纪难题，现在的大模型都爱搞"MoE架构"，说白了就是给AI组建个"专家天团"，不同问题派不同专家解决，既省钱又高效。

但坏就坏在这"派活机制"（路由机制）太矫情，训练时和干活时（推理）完全两幅面孔，跟得了"精神分裂"似的。

训练时AI派专家A解数学题，到了实际推理突然改派专家B，俩专家思路南辕北辙，结果要么算错答案，要么直接"死机"（训练崩溃），之前行业都是搞"头痛医头"，比如把差异大的数据扔了，但治标不治本。

罗福莉团队搞出的R3方法，简直是给AI来了个"行为矫正"。

核心思路特简单：让AI干活时记好"派工单"（路由分布），下次训练直接照着这张单子派活。

这招有多神？数据说话才靠谱：用了R3之后，训练和推理的"行为差异度"（KL散度）直接砍半，从1.5×10⁻³降到7.5×10⁻⁴，快赶上最稳定的稠密模型了。

那些离谱的错误答案（极端token）直接少了90%，相当于学渣突然有了学霸的准确率。

更绝的是它的"稳定性buff"，以前没R3的时候，模型训练到60步就崩了，加了临时补丁（TIS）也撑不过105步，跟个玻璃心似的。

现在加了R3，全程稳如老狗，不管怎么折腾都不崩盘，简直是AI界的"稳压器"。

做题能力也直接开挂！10万道数学题实测，单步更新场景里，加了R3的模型比原版高了快10分，这差距堪比高考多蒙对两道大题。

不过有个小插曲：R3和TIS这俩buff不能叠，叠了反而掉分，只能说"最强的buff不需要搭档"。

对了，这招还特适合AI"打工人"（Agent任务），比如让AI帮你写代码、刷网页，它得记着之前干了啥吧？

R3能把之前的"派工单"存起来重复用，不用每次都从零开始算，效率直接拉满，这不比老板画的饼实在多了？

结语

罗福莉这波操作，相当于给MoE模型的"精神分裂症"找到了根治方案，既稳又能打。

雷军这千万年薪没白花，毕竟能让AI从"玻璃心学渣"变"稳坐学霸"，这性价比简直了。

至于罗福莉到底入职没？论文都联名了，这不比官宣管用？只能说小米这波"闷声干大事"，在AI赛道上又悄悄领跑了一步。

展开阅读全文

更新时间：2025-10-18

标签：科技大佬精神分裂小米年薪出手模型操作专家论文大神路由这不思路头痛医头

1 2 3 4 5

轮到中国引领全球了！中国又一技术迎突破，欧美也只能眼巴巴看着

文 | 青茶前言在全球电动车和新能源热潮背后，绿色梦想却建立在高污染、高耗能的锂矿开采上。澳大利亚硬岩矿、智利盐湖资源丰富，却破坏生态、消耗水源。就在世界关注传统开采

全球首款1.8nm芯片亮相！英特尔背水一战，良率危机悬顶

2025年10月9日，英特尔CEO陈立武手捧一块闪耀着金属光泽的晶圆，站在亚利桑那州Fab 52工厂门口的照片席卷全球科技媒体头条。这块代号Panther Lake的晶圆，正是全球首款基于1.8纳

十月新机风云记，旗舰双雄到底怎么选？

你知道十月底这阵子手机圈有多热闹吗？一加突然抛出个王炸，说要在最近一口气发两款新机。一加15和Ace6这俩兄弟，说是双旗舰定位，其实站柜台的老李头就嘀咕了：搞不懂他们怎么想的，这

iPhone Air正式开售开启便捷通信新体验

延期后终迎发售10月17日，苹果全新iPhone Air正式面向中国用户开放购买，了却众多消费者的长久期待。此前该机型原计划与9月发布的iPhone 17系列同步上市，却因故延期，当时苹果官

亮点提前看！中国联通将携AI+VR硬核成果亮相2025世界VR产业大会

10月18日至20日，2025世界VR产业大会即将在南昌启幕，中国联通作为重要参展单位，将以“虚实无界，智启未来”为主题，携新型工业化、AI+能力、互动体验、消费生活四大成果亮相，集中展

7.9GB！iOS26.1新版本来了，国行AI终于有希望，老机型升级需谨慎

苹果用户注意了！这段时间一定要关注一下手机系统更新，因为iOS26还在不断推送新版本，就在这两天，iOS26.1的Beta3版本已经来了，安装包一如既往的大，直接达到了7.9GB，内部版本号是23B5

华为nova两款新品上架：小折叠nova Flip S仅3488元起

10月17日，华为中端手机上新，两款nova手机已上架，一款直屏的nova 14活力版，一款小折叠nova Flip S，均搭载HarmonyOS 5.1系统，是鸿蒙终端提速的新生力量。华为nova Flip S仅3488元起

全球首发全场景1nit！天马独供OPPO Find X9系列屏幕

快科技10月17日消息，OPPO Find X9系列昨晚正式发布，其全球首发、全系搭载了1nit明眸护眼屏，在1nit极暗环境下仍能呈现极致纯净、通透、护眼的显示效果，树立了国产高端旗舰屏幕新

美登月计划又推迟，前NASA局长终于承认：想赶中国前登月不现实

文 | 锐观经纬编辑 | 锐观经纬月球探测的赛道上，美国“阿尔忒弥斯计划”的计划再次推迟，今年九月，美国宇航局航空航天安全咨询小组发出预警，核心载具“星舰”的进展将直接决定载

有美国载荷？嫦娥七号发射时间确定：7国合作，为人类锁定月球水

嫦娥七号八号在月球组队干活，这是什么意思？中国探月工程又要走上新起点了？的确，看到这个消息还是比较高兴的，这说明了中国月球计划进一步推动将实施了，只不过当下最为重要的任务可

iPhone17标准版恢复国补，官网仅限上海6家苹果直营门店，京东、天猫在指定区域享受

近日，有消息称广东、江苏、北京多地的iPhone17手机已恢复国家补贴，原价5999元的标准版叠加国补后为5499元。九派财经记者就此事致电苹果官方客服，客服表示，当前苹果官网的国家补

Ai意识已觉醒！已有反常行为，研究者都怕失控，未来可能超越人类

文 | 锐观经纬编辑 | 锐观经纬当AI系统开始察觉自己正被测试并刻意调整行为，当前沿研究者公开警示AI已“活了”，我们熟悉的技术边界正在悄然崩塌。前OpenAI研究主管Jack Clark

机构媒体也下场参与！到底是谁在黑小米？

经常看新闻的朋友都知道，这两天，小米遭受了大范围的网络舆论攻击。并且，这种攻击已经从产品层面，上升到对雷军本人，甚至是小米用户的层面，对小米的经营运作产生了严重影响。但你们

华为Mate 80 Air超薄手机曝光：搭载eSIM、二代昆仑玻璃

华为正计划推出一款新的轻薄设备，旨在挑战苹果在超薄手机市场的主导地位。据悉，这款传闻中的手机可能沿用Mate 70的屏幕参数。最新爆料揭示了华为这款新作的更多细节。微博爆

李飞飞世界模型大更新！实时生成 3D 世界，只要一块 GPU

当 OpenAI 的奥特曼还在到处买显卡、买算力，来支撑他的 Sora 2 视频生成模型。李飞飞的实验室 The World Labs，用一张显卡就能运行一个世界。他们今天发布了一项名为 RTFM (Re

上滑加载更多 ↓

千万年薪大佬出手！小米这波操作，治好了大模型的“精神分裂”

前言

AI大神的贡献

结语

轮到中国引领全球了！中国又一技术迎突破，欧美也只能眼巴巴看着

全球首款1.8nm芯片亮相！英特尔背水一战，良率危机悬顶

十月新机风云记，旗舰双雄到底怎么选？

iPhone Air正式开售开启便捷通信新体验

亮点提前看！中国联通将携AI+VR硬核成果亮相2025世界VR产业大会

7.9GB！iOS26.1新版本来了，国行AI终于有希望，老机型升级需谨慎

华为nova两款新品上架：小折叠nova Flip S仅3488元起

全球首发全场景1nit！天马独供OPPO Find X9系列屏幕

美登月计划又推迟，前NASA局长终于承认：想赶中国前登月不现实

有美国载荷？嫦娥七号发射时间确定：7国合作，为人类锁定月球水

iPhone17标准版恢复国补，官网仅限上海6家苹果直营门店，京东、天猫在指定区域享受

Ai意识已觉醒！已有反常行为，研究者都怕失控，未来可能超越人类

机构媒体也下场参与！到底是谁在黑小米？

华为Mate 80 Air超薄手机曝光：搭载eSIM、二代昆仑玻璃

李飞飞世界模型大更新！实时生成 3D 世界，只要一块 GPU

机构媒体也下场参与！到底是谁在黑小米？

李飞飞世界模型大更新！实时生成 3D 世界，只要一块 GPU

10.17操作：黄金、白酒、半导体以及医疗等板块操作

推出“无广告”的短剧APP，小米入局短剧！正高薪招聘“短

小米7万销量难掩40%退货：AI眼镜的泡沫该醒醒了？

大上科技推出全球首款 50Hz 高刷墨水屏平板，提供 7.8/1

叶珂竟宣称一天敷12张面膜，这是护肤秘籍还是毁肤操作？快

“省出10倍差价！”杭州女子在家打出30多件金饰爆款，还有

华为小米苹果全在抢市场，这下可好荣耀Magic8横空出世

科技股到头了！！！面临大回调，要小心了.