
2月25日消息,智能纪元AGI独家获悉,“AI教母”、斯坦福大学教授李飞飞领衔研发团队,于今天发表了一篇最新论文:从试错中学习:具身大模型的反思式测试时规划(Learning from Trials and Errors: Reflective Test-Time Planning for Embodied LLMs)。

本论文提出了一种名为"反思性测试时规划"的框架,旨在解决具身大语言模型在部署过程中无法从失败中学习的问题。该框架通过整合两种反思模式:反思-in-action和反思-on-action,使代理能够在执行前通过内部模拟评估候选动作,并在执行后通过外部反馈更新其决策系统。
这篇论文技术的核心创新,在于引入回顾性反思机制,允许代理利用事后视角重新评估早期决策,解决长程任务中的信用分配问题。
实验表明,该方法在自研的长程家庭任务基准和MuJoCo橱柜装配任务中显著优于基线模型,通过消融实验验证了两种反思模式的互补性。定性分析显示,代理通过反思机制减少了重复性错误,实机实验进一步证明了其在真实机器人中的有效性。该研究为具身AI系统提供了动态适应环境变化的新范式。
基于LoRA实验测试的结果显示,该框架在橱柜任务中达到60.2%适配率,与全参数训练仅相差2.8个百分点,但计算成本降低5倍。


值得一提的是,就在2月18日,李飞飞创立的World Labs公司再获10亿美元(约合70亿元人民币)的新一轮融资。
据早前报道,该公司最新估值有望达到约50亿美元(约合350亿元人民币)。
“我们非常感谢并兴奋地与包括 AMD、Autodesk、Emerson Collective、Fidelity Management & Research Company、NVIDIA 和 Sea 在内的投资者携手合作。我们致力于加速推进空间智能的使命,构建世界模型,从而革新故事讲述、创造力、机器人技术、科学发现等领域。”World Labs表示,其第一款产品Marble可以让任何人通过图像、视频或文本创建空间连贯、高保真且持久的 3D 世界。
从登场到50亿美元的估值,李飞飞仅用了16个月的时间。
李飞飞曾在访谈中表示,World Labs研发的这项技术,可能颠覆Unity和Epic Games的Unreal Engine等传统游戏引擎和3D引擎。
更新时间:2026-02-26
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号