NeurIPS 2022人工智能国际顶级会议:华人团队获奖论文研究详解

一年一度的人工智能国际顶级会议NeurIPS 2022(Neural Information Processing Systems,中文名称神经信息处理系统大会)去年底在美国顺利举办完成。NeurIPS会议成立于1987年,2022年是NeurIPS举办的第36届。NeurIPS 2022比赛一共两周(11月28日至12月9日):第一周在美国新奥尔良举行,第二周则转为线上会议。

按照往年惯例,NeurIPS组委会将正式公布获奖论文名单,三项大奖分别是杰出论文奖(Outstanding Main Track Papers)、杰出数据集和基准论文奖(Outstanding Datasets and Benchmark Track papers)和时间检验奖(Test of Time paper)。NeurIPS 2022共收到了10411篇论文,其中2672篇在审查后获得接收,接收率仅为25.6%。

在获奖名单上,NeurIPS 2022共有13篇论文获得杰出论文奖,数量是去年(6篇)的两倍。杰出数据集和基准论文奖有2篇获奖,时间检验奖有1篇获奖,数量与去年持平。NeurIPS 2022获奖的16篇论文中,主要由华人团队提供的获奖论文共4篇,其中杰出论文奖3篇、杰出数据集和基准论文奖1篇。下面Ruicy具体介绍下这4篇主要由华人团队完成的获奖论文的研究领域、研究关键词,以及取得的重大研究贡献:

1 杰出论文奖:Is Out-of-Distribution Detection Learnable?

作者:Zhen Fang、Yixuan Li、Jie Lu、 Jiahua Dong、Bo Han、Feng Liu

关键词: AI 可靠性

监督学习的目的是在训练和测试数据来自同一分布的假设下训练一个分类器。为了缓解上述假设,研究人员研究了一个更现实的环境:分布外(OOD)检测,重点是这种模型可学习的条件。

该工作使用可能近似正确(PAC)的学习理论表明,OOD检测模型仅在数据分布空间和预测模型空间的某些条件下是PAC可学习的。它提供了3个具体的不可能定理,可以很容易地应用于确定OOD检测在实际环境中的可行性,在这项工作中,它被用来为现有的OOD检测方法提供理论基础。这项工作还提出了新的理论问题,例如,关于近OOD检测的可学习性。因此,它有可能在这个重要的研究领域产生广泛的理论和实践影响。

2 杰出论文奖:A Neural Corpus Indexer for Document Retrieval

作者:Yujing Wang、Yingyan Hou、Haonan Wang等

关键词:文档检索,序列对序列,基于模型的索引

目前最先进的文档检索解决方案主要遵循索引-检索的范式,其中索引很难直接针对最终的检索目标进行优化。

在本项工作提出了一个神经索引器,它将查询作为输入,并通过解码器与波束搜索相结合,输出一个与索引中相关文件相对应的ID列表。它加入了一个小型但不断增长的研究系列,该系列偏离了主流的高召回-稀疏检索范式。

值得注意的是,这种新范式允许使用标准的深度学习算法和框架对目标应用的索引器进行基于梯度的优化。所提出的方法引入了架构和训练选择,与之前的工作相比,有了明显的改进,证明了神经索引器作为一种可行的替代方案的前景。论文写得很好,并讨论了这项工作之后的局限性和开放性问题,这可以作为未来研究的灵感。

3 杰出论文奖:Gradient Estimation with Discrete Stein Operators

作者:Jiaxin Shi、Yuhao Zhou、Jessica Hwang等

关键词:梯度估计,斯坦因方法,马尔科夫链,分数函数,REINFORCE,离散潜变量,VAE,控制变量,方差减少

梯度估计——接近期望值与分布参数的梯度——是解决许多机器学习问题的核心。

然而,当分布是离散的时候,大多数常见的梯度估计器都存在过度的方差。本篇论文考虑当分布是离散的时候的梯度估计。大多数常见的梯度估计器都存在过度的方差。

为了提高梯度估计的质量,他们介绍了一种基于离散分布的Stein算子的方差减少技术。尽管Stein算子是经典的,但这项工作为梯度估计提供了一个很好的解释,并在实验中显示了实际的改进。

4 杰出数据集和基准论文奖:MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge

作者:Linxi Fan, Guanzhi Wang, Yunfan Jiang等(作者中的Linxi Fan和Yuke Zhu是美籍华裔院士、斯坦福大学教授李飞飞的“亲传弟子”。)

关键词:自主代理(Embodied Agents),Minecraft,开放式学习,多任务学习,互联网知识库,强化学习,大型预训练

自主代理在诸如Atari雅达利游戏和围棋等专业领域取得了巨大的进步。然而,它们通常是在孤立的环境中以有限的、人工设想的目标进行学习,通常不能在广泛的任务和能力方面进行普及和推广。

这项工作介绍了MineDojo,这是一个建立在流行的Minecraft游戏上的新框架,其特点是具有数千个不同的开放式任务的模拟套件和一个具有Minecraft视频、教程、维基页面和论坛讨论的互联网规模的知识库。它还提出了一种新颖的代理学习算法,能够解决以自由形式语言指定的各种开放式任务。它提供了一个开源的模拟套件、知识库、算法实现和预训练的模型(https://minedojo.org),以促进对具有普遍能力的具身代理的研究。

另外,再分享一个好消息,在NeurIPS 2022的MyoChallenge挑战赛中,由北京大学人工智能研究院杨耀东助理教授、计算机学院前沿计算研究中心董豪助理教授共同指导,北京大学信息科学技术学院2020级图灵班本科生Yiran Geng和Boshi An作为共同第一作者获得Die Reorientation赛道冠军。

挑战赛提供了一套高逼真度的肌肉-骨骼灵巧手模型以及交互环境,参赛者需要设计一套科学有效的训练方法,培养出一个通用的人工智能算法,来控制仿生灵巧手完成随机的抓取、转动骰子等既定任务,最终成功率最高、需要肌肉施加力最小的团队将获胜。该挑战吸引了来自全球十多个国家的40个顶尖队伍参加,共产生了340余份有效方案。

比赛的核心竞争集中在寻找一个能够适应特殊手部控制模型以及参数随机化的策略,也就是说,因材施教地指导人工智能自主学习。对耿逸然和安博施来说,在特定的问题背景中选取合适的方法成为最大的挑战。在经历了几次尝试的失败后,他们决定采用强化学习框架来在模拟器里训练他们的策略,通过奖励塑造(Reward Shaping)、课程学习(Curriculum Learning)和多目标训练(Multi-target Training)等技巧来提高训练后的策略的性能。


展开阅读全文

页面更新:2024-02-02

标签:人工智能   方差   论文   梯度   基准   详解   杰出   索引   模型   团队   会议   华人   作者   工作   国际

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top