NeurIPS 2022人工智能国际顶级会议：华人团队获奖论文研究详解

一年一度的人工智能国际顶级会议NeurIPS 2022（Neural Information Processing Systems，中文名称神经信息处理系统大会）去年底在美国顺利举办完成。NeurIPS会议成立于1987年，2022年是NeurIPS举办的第36届。NeurIPS 2022比赛一共两周（11月28日至12月9日）：第一周在美国新奥尔良举行，第二周则转为线上会议。

按照往年惯例，NeurIPS组委会将正式公布获奖论文名单，三项大奖分别是杰出论文奖（Outstanding Main Track Papers）、杰出数据集和基准论文奖（Outstanding Datasets and Benchmark Track papers）和时间检验奖（Test of Time paper）。NeurIPS 2022共收到了10411篇论文，其中2672篇在审查后获得接收，接收率仅为25.6%。

在获奖名单上，NeurIPS 2022共有13篇论文获得杰出论文奖，数量是去年（6篇）的两倍。杰出数据集和基准论文奖有2篇获奖，时间检验奖有1篇获奖，数量与去年持平。NeurIPS 2022获奖的16篇论文中，主要由华人团队提供的获奖论文共4篇，其中杰出论文奖3篇、杰出数据集和基准论文奖1篇。下面Ruicy具体介绍下这4篇主要由华人团队完成的获奖论文的研究领域、研究关键词，以及取得的重大研究贡献：

1 杰出论文奖：Is Out-of-Distribution Detection Learnable?

作者：Zhen Fang、Yixuan Li、Jie Lu、 Jiahua Dong、Bo Han、Feng Liu

关键词： AI 可靠性

监督学习的目的是在训练和测试数据来自同一分布的假设下训练一个分类器。为了缓解上述假设，研究人员研究了一个更现实的环境：分布外（OOD）检测，重点是这种模型可学习的条件。

该工作使用可能近似正确（PAC）的学习理论表明，OOD检测模型仅在数据分布空间和预测模型空间的某些条件下是PAC可学习的。它提供了3个具体的不可能定理，可以很容易地应用于确定OOD检测在实际环境中的可行性，在这项工作中，它被用来为现有的OOD检测方法提供理论基础。这项工作还提出了新的理论问题，例如，关于近OOD检测的可学习性。因此，它有可能在这个重要的研究领域产生广泛的理论和实践影响。

2 杰出论文奖：A Neural Corpus Indexer for Document Retrieval

作者：Yujing Wang、Yingyan Hou、Haonan Wang等

关键词：文档检索，序列对序列，基于模型的索引

目前最先进的文档检索解决方案主要遵循索引-检索的范式，其中索引很难直接针对最终的检索目标进行优化。

在本项工作提出了一个神经索引器，它将查询作为输入，并通过解码器与波束搜索相结合，输出一个与索引中相关文件相对应的ID列表。它加入了一个小型但不断增长的研究系列，该系列偏离了主流的高召回-稀疏检索范式。

值得注意的是，这种新范式允许使用标准的深度学习算法和框架对目标应用的索引器进行基于梯度的优化。所提出的方法引入了架构和训练选择，与之前的工作相比，有了明显的改进，证明了神经索引器作为一种可行的替代方案的前景。论文写得很好，并讨论了这项工作之后的局限性和开放性问题，这可以作为未来研究的灵感。

3 杰出论文奖：Gradient Estimation with Discrete Stein Operators

作者：Jiaxin Shi、Yuhao Zhou、Jessica Hwang等

关键词：梯度估计，斯坦因方法，马尔科夫链，分数函数，REINFORCE，离散潜变量，VAE，控制变量，方差减少

梯度估计——接近期望值与分布参数的梯度——是解决许多机器学习问题的核心。

然而，当分布是离散的时候，大多数常见的梯度估计器都存在过度的方差。本篇论文考虑当分布是离散的时候的梯度估计。大多数常见的梯度估计器都存在过度的方差。

为了提高梯度估计的质量，他们介绍了一种基于离散分布的Stein算子的方差减少技术。尽管Stein算子是经典的，但这项工作为梯度估计提供了一个很好的解释，并在实验中显示了实际的改进。

4 杰出数据集和基准论文奖：MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge

作者：Linxi Fan, Guanzhi Wang, Yunfan Jiang等（作者中的Linxi Fan和Yuke Zhu是美籍华裔院士、斯坦福大学教授李飞飞的“亲传弟子”。）

关键词：自主代理（Embodied Agents），Minecraft，开放式学习，多任务学习，互联网知识库，强化学习，大型预训练

自主代理在诸如Atari雅达利游戏和围棋等专业领域取得了巨大的进步。然而，它们通常是在孤立的环境中以有限的、人工设想的目标进行学习，通常不能在广泛的任务和能力方面进行普及和推广。

这项工作介绍了MineDojo，这是一个建立在流行的Minecraft游戏上的新框架，其特点是具有数千个不同的开放式任务的模拟套件和一个具有Minecraft视频、教程、维基页面和论坛讨论的互联网规模的知识库。它还提出了一种新颖的代理学习算法，能够解决以自由形式语言指定的各种开放式任务。它提供了一个开源的模拟套件、知识库、算法实现和预训练的模型(https://minedojo.org)，以促进对具有普遍能力的具身代理的研究。

另外，再分享一个好消息，在NeurIPS 2022的MyoChallenge挑战赛中，由北京大学人工智能研究院杨耀东助理教授、计算机学院前沿计算研究中心董豪助理教授共同指导，北京大学信息科学技术学院2020级图灵班本科生Yiran Geng和Boshi An作为共同第一作者获得Die Reorientation赛道冠军。

挑战赛提供了一套高逼真度的肌肉-骨骼灵巧手模型以及交互环境，参赛者需要设计一套科学有效的训练方法，培养出一个通用的人工智能算法，来控制仿生灵巧手完成随机的抓取、转动骰子等既定任务，最终成功率最高、需要肌肉施加力最小的团队将获胜。该挑战吸引了来自全球十多个国家的40个顶尖队伍参加，共产生了340余份有效方案。

比赛的核心竞争集中在寻找一个能够适应特殊手部控制模型以及参数随机化的策略，也就是说，因材施教地指导人工智能自主学习。对耿逸然和安博施来说，在特定的问题背景中选取合适的方法成为最大的挑战。在经历了几次尝试的失败后，他们决定采用强化学习框架来在模拟器里训练他们的策略，通过奖励塑造（Reward Shaping）、课程学习（Curriculum Learning）和多目标训练（Multi-target Training）等技巧来提高训练后的策略的性能。

展开阅读全文

页面更新：2024-02-02

标签：人工智能方差论文梯度基准详解杰出索引模型团队会议华人作者工作国际

1 2 3 4 5

NeurIPS 2022人工智能国际顶级会议：华人团队获奖论文研究详解

1 杰出论文奖：Is Out-of-Distribution Detection Learnable?

2 杰出论文奖：A Neural Corpus Indexer for Document Retrieval

3 杰出论文奖：Gradient Estimation with Discrete Stein Operators

4 杰出数据集和基准论文奖：MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge

荣耀旗舰基本确定，彻底迎来新一波转折，新的征程要来了

大厂纷纷撤离虚拟现实领域？你们想多了

刚刚，苹果推出348元新品！其实明明可以直接抢的

2023年口碑最好的四款手机，荣耀、华为都有，体验出色值得闭眼入

悬停空间、双指分屏、跨屏分享，这些好用的折叠屏交互你用过吗？

vivo自拍旗舰，上市两个月下跌480元，12GB+256GB+5000万追焦前摄

全国计算机等级二级考试新科目—openGauss数据库程序设计

魅族18S：直接降1100元给新机让路，黄章要卷土重来了

美团创始人轻视自己，别迷信他人

手机内存买多大？K60掀起512G普及风暴，2999用5年还很流畅

一加V Fold折叠机工程机曝光：配备2K大屏定档Q3

内存爆满！删掉华为手机这6个占比超大的文件夹，瞬间释放30G

联想这是真的降价了！拯救者R9000P直降1299元，捡漏就趁换代时节

AITO问界M5将在二季度迎来改款，搭载华为智能驾驶

iPhone14暴降1500元，为什么手机卖不动，手持小米11Ultra告诉你

打造开发者生态上海品牌临港将举办全球人工智能开发

拼经济大潮起！潮州市政府工作报告出炉，今年GDP预增6%左

国际油价先跌后涨，本轮国内成品油价不作调整

1-4！中国女足国际舞台惨败，15分钟连丢3球，水庆霞世界杯需

技术论文-低碳约束下冷链物流配送共享仓选址多目标优

（国际）探访泰国皮皮岛国家公园

高并发编程系列（七）Netty Handler底层原理源码详解

祁阳商务局：引外资稳外贸促消费推进商务工作高质量

FM独家：伯利亲自见内马尔团队，潜在离队方式包括直接解约

Angew：华中科大钟芳锐团队铜酶杂泛性拓展催化氧化交叉