腾讯实验室成果:拥挤场景行人检测

这篇论文的标题是“NMS-Loss: Learning with Non-Maximum Suppression for Crowded Pedestrian Detection”。作者是Zekun Luo,Zheng Fang,Sixiao Zheng,Yabiao Wang和Yanwei Fu。他们分别来自腾讯的Youtu实验室,北京航空航天大学,复旦大学和复旦大学。论文摘要提到了一种新的NMS-Loss方法,它可以在训练过程中端到端地训练NMS过程,而不需要任何额外的网络参数。这种方法在Caltech数据集和CityPersons数据集上都取得了优于现有技术的结果。

这篇论文提出了一个新的NMS-Loss方法,旨在解决在拥挤的行人检测场景中,由于NMS引入的假阳性(FP)和假阴性(FN)对评估结果的影响。作者提出了一个新颖的NMS-Loss,使NMS过程可以在不增加任何额外网络参数的情况下端到端地进行训练。

在拥挤的行人检测场景中,假阴性(FN)和假阳性(FP)仍然是根本性的挑战由于NMS过程在训练过程中没有被考虑,因此训练目标与评估指标之间存在不一致性,这可能导致行人检测性能不佳。为了解决这个问题,作者提出了一种新颖的NMS-Loss方法,将NMS过程纳入训练过程中,从而调整检测框,消除训练目标与评估指标之间的不一致性。

NMS-Loss包括两个部分:pull loss和push loss。pull loss旨在通过将FP拉近最高分预测来提高精度。具体来说,当FP未被NMS抑制时,pull loss将在最高分预测和FP之间执行。push loss则专注于通过将预测推离彼此来提高召回率。在NMS中,当前最高分预测会消除与其重叠超过预定义阈值的框。如果被消除的框与当前最高分预测对应不同的ground truth,则该框将成为FN并降低召回率。为了避免该框被错误消除,作者提出了一种push loss来惩罚FN。


根据论文中的实验结果,NMS-Loss在Caltech数据集和CityPersons数据集上都取得了优于现有技术的结果。在CityPersons数据集上,使用NMS-Loss的NMS-Ped方法将基线方法的MR从11.20%降低到10.08%,优于现有技术中最好的EMD-RCNN方法(MR为10.70%)。在Caltech数据集上,NMS-Ped的MR为5.92%,优于现有技术中最好的W2Net方法(MR为6.37%)。这些结果表明,NMS-Loss能够有效地解决由于NMS引入的假阳性(FP)和假阴性(FN)对评估结果的影响。

展开阅读全文

页面更新:2024-04-23

标签:行人   复旦大学   腾讯   阴性   阳性   拥挤   最高分   实验室   场景   成果   过程   方法   作者   数据   论文

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top