遮挡行人检测的特征校准网络

arxiv 2022 12月论文, Accepted by IEEE Transactions on Intelligent Transportation Systems

论文题目:

Feature Calibration Network for Occluded Pedestrian Detection

论文地址:

https://arxiv.org/abs/2212.05717

摘要

在野外行人检测仍然是一个具有挑战性的问题,特别是在包含严重遮挡的场景,在本文中,我们在深度学习框架中提出了一种新的特征学习方法,称为特征校准网络(FC-Net),用于自适应检测各种遮挡下的行人。FC- net基于对行人可见部分的选择性和决定性检测的观察,并实现为具有自激活(SA)模块和特征校准(FC)模块的自节奏特征学习框架,以一种新的自激活方式,FC-Net学习突出可见部分和抑制行人遮挡部分的特征。SA模块通过重用分类器权重来估计行人激活地图,而不涉及任何额外的参数,因此产生了一个极其简约的模型,以加强特征的语义,而FC模块校准卷积特征,以像素和基于区域的方式进行自适应行人表示。在CityPersons和Caltech数据集上的实验表明,FC-Net对被遮挡行人的检测性能提高了10%,同时在未被遮挡的情况下保持优异的性能。

1 简介

行人检测是计算机视觉领域的一个重要研究课题,由许多现实应用驱动,包括自动驾驶,视频监控和机器人,随着深度学习的兴起,行人检测在简单场景中取得了前所未有的性能。但在复杂场景中,对严重遮挡行人的检测性能仍不尽如人意,当遮挡率高于35%时,最先进的方法在每张图像0.1假阳性(FPPI)时报告漏报率大于50%。这严重阻碍了行人检测在现实场景中的部署。

为了解决遮挡问题,一种常用的方法是基于部分的模型,它利用分治策略来处理可见部分和遮挡部分,但由于部分数量有限,且采用固定部分划分策略,在处理复杂遮挡时存在不足。另一种常用的方法是注意模型,它通过引入特征强制和/或采样模块,将“硬”对象部分替换为“软”注意区域。然而,注意力模型通常与检测器学习过程并行运行,忽略了检测器产生的特定于类的语义信息,这可能会混淆消极和积极的关注区域,并使功能实施的方向可疑。

在本文中,我们提出了自激活(SA)和特征校准(FC)模块,目标是使卷积特征适应不同遮挡的行人,SA模块定义了行人与卷积特征通道的对应关系,不涉及任何附加参数,这种关系通过在检测网络学习过程中构造的分类器权重向量来体现,通过以通道方式将这样的权重向量与特征图相乘,收集跨通道的视觉模式并计算行人激活图,如图1所示。

激活映射被进一步馈送到FC模块,以增强或抑制基于像素和基于区域的方式的卷积特征,将SA和FC模块与深度检测网络集成,形成了我们的特征校准网络(FC- net),在每次学习迭代中,FC-Net迭代地更新分类器权重,这些权重被重用来校准特征,校准的关键思想是利用行人激活图作为一个指标来加强可见行人部分的特征,同时抑制遮挡行人区域的特征,通过多次迭代的特征校准,FCNet以自定速度的方式仔细学习行人表示的判别特征。

这项工作的贡献包括:

(1)我们提出了一种自激活方法,并通过重用检测网络的分类器权重提供了一种简单而有效的方法来估计行人激活图。

(2)设计特征校正模块,将深度检测网络升级为特征校正网络(FCNet),突出行人可见部分,抑制遮挡部分。

(3)我们将FC-Net应用于常用的行人检测基准,以轻微的计算开销实现了最先进的检测性能,我们也验证了FC-Net在一般目标检测中的适用性。

本文的其余部分组织如下,第二部分介绍了行人检测和遮挡处理的相关工作,在第三节中,介绍了SA和FC模块的实现细节,第四节介绍了FC-Net行人检测的学习过程,我们在第五节展示了实验,并在第六节总结了本文。

2相关工作

行人检测的研究历史悠久,提出了各种特征表示方法,包括梯度直方图(HOG),局部二进制模式(LBP),积分通道特征(ICF),以及知情的haar特征。采用了3-D距离传感器、近红外摄像机、立体摄像机、CCD摄像机及其组合等5种传感器,在接下来的内容中,我们主要回顾了卷积神经网络(cnn)和关于遮挡处理的模型的方法。

A.行人检测

随着深度学习的兴起,行人检测方法从手工制作的特征转向基于cnn的特征,早期的方法侧重于探索有效的网络架构和特征学习的超参数,自2014年以来,RCNN融合了高质量的区域建议和深度特征表示,一直在目标检测领域处于领先地位。在接下来的几年里,Fast R-CNN和Faster R-CNN被提出来聚合特征表示,提高检测效率。这些方法利用深度学习特征进行一般目标检测,取得了前所未有的良好性能。

尽管这些方法对一般物体检测有效,但检测严重遮挡的行人仍然是一个开放和具有挑战性的问题,正如现有的最先进方法的低性能所表明的那样(当每张图像的假阳性率为0.1时,漏报率通常高于50%),性能较低的主要原因是行人被遮挡部分产生的随机特征显著降低了卷积特征的表示能力,如何抑制被遮挡区域的特征,同时增强行人可见部分的特征,还需要进一步研究。

B.遮挡处理

基于部分模型 被遮挡行人检测的一个主要方法是基于部分的模型,它利用分治策略,即使用不同的部分检测器来处理不同遮挡的行人。Zhang等提出了CircleNet来实现往复特征适应,并使用了实例分解训练策略。研究提出了一种联合深度学习框架,并使用多级部分检测图来估计遮挡模式。其他提出了一种遮挡感知RCNN (OR-CNN),具有聚合损失和部分遮挡感知感兴趣区域(PORoI)池化,作者强制建议接近相应的物体,同时整合人体的先验结构来预测可见部分。

注意模型 另一种方法是基于注意力的模型,通过引入注意力或显著性模块[6],,将“硬”物体部分替换为“软”注意区域。

提出了带有注意力引导的Faster R-CNN (fastrcnn - ATT)来检测遮挡实例,假设每个遮挡模式可以表示为身体部位的组合,提出了一种部分注意机制,通过从多个通道挤压特征来表示不同的遮挡模式。Ghose等使用显著图来增强热图像,这是一种行人探测器的注意机制,特别是在白天。

注意/显著性的引入提高了行人检测的性能,然而,现有的大多数方法忽略了检测网络产生的类特异性置信度,因此很难区分积极和消极的注意区域,在[6]中,设计了斥力损失(RepLoss)方法来加强拥挤场景中的行人定位,使用RepLoss,每个提议都被迫关注其指定的目标,同时远离其他真对象,然而,尽管空间定位被聚合,但特征的识别能力并没有得到增强。

生成模型 我们探索了生成方法来生成训练样本,解决遮挡问题。Cycle GAN方法将合成图像转换为现实场景,用于数据增强。pedestrian-synthesis-gan生成标记行人数据,并使用这些数据来增强行人探测器的性能,同时使用结构上下文描述符描述人群场景中个体的结构特性。基于域自适应的加权多数投票方法[49]用于其他视觉任务的标签生成。

在本文中,我们提出了自激活方法来探索由检测网络预测的类特定置信度,我们的方法不仅可以从可见的行人部位区分被遮挡的区域,还可以与检测网络结合,以自适应的方式加强特征学习,自激活方法是受类激活映射(CAMs)的启发,这是一种自顶向下的特性激活方法。但与CAM有本质区别,CAM的激活是在特征学习过程中进行的,而CAM的激活是在网络训练完成后进行的,我们的工作还与挤压激励(SE)网络有关,该网络通过显式建模通道之间的相互依赖关系,自适应地重新校准通道特征响应,不同之处在于,我们的方法利用了分类器中“压缩”的语义信息,因此更有效地加强了特征的鉴别能力。

3特征校准

我们的特征校准网络(FC-Net)的核心是一个自激活(SA)模块,如图2所示,它通过重用分类器权重来估计行人激活图,而不涉及任何额外的参数,行人激活图用于使用特征校准(FC)模块以像素级和基于区域的方式操作网络,分别如图3和图4所示,在网络训练期间迭代调用SA和FC模块,以加强可见部分,同时抑制遮挡区域。

A.自激活(SA)

在Faster-RCNN框架中,行人分类器输出y(Z) = f(WTZ + b)由一个线性模型和一个非线性函数组成,对于二元分类问题,网络在分类器的全连接层中有两个权重向量,一个用于行人,另一个用于背景。行人的权重向量,记为W = (w1, w2,…), wC)T RC,其中C为特征通道数,如图2所示,由特征Z表示的不同特征通道检测到不同的行人部位,如图1所示,为了反映输出y(Z)中检测到的部分,它们对应的权值必须很大,如果有些通道只检测到背景部分,它们对应的权重应该很小,这意味着权重实际上“挤压”了行人表示的通道级语义信息。自激活模块(图2)重用分类器权重中压缩的语义信息来构建行人激活图,该过程通过对所有卷积特征通道进行加权和求和来实现,具体来说,设Y RM N C为图像的卷积特征图,其中M和N分别表示特征图的宽度和高度,行人激活图上的元素Am,n, A RM N,计算为

其中m和n表示特征映射上的二维坐标,c是特征通道的索引,基线检测器为配置了ResNet的Faster RCNN,其在Conv5之后有一个全局平均池化(GAP)层,如图5所示,GAP层将特征映射(通道)的多个值转换为单个值,结果,多个特征映射被转换为一个向量,该向量与分类器具有相同的元素号。

对于行人来说,不同的特征通道对不同的部分敏感,因为针对不同的视觉模式学习卷积滤波器(wc·Y c),得益于RoI池化(参见后面的图5)不改变特征通道的顺序,学习过程在特征通道和权重向量之间构建了统计关系,权重元素越大,对应的特征通道信息量越大,通过公式1,我们可以将视觉模式聚合到行人激活图中,这表明像素对行人表示的统计重要性,使用行人激活图,我们可以从可见的行人部分强制特征,以及当相应的特征通道或权重值较小时抑制遮挡区域。

B.特征校正(FC)

为了利用合并到行人激活图中的信息,我们跟随它进行了一个特征校准步骤,旨在聚合卷积特征,为了实现这一目标,这样的校准有望有效地处理遮挡,首先,它应该适应空间遮挡(特别是,它必须能够抑制在遮挡区域上输出高特征值的通道),其次,它应该包含上下文信息,以便当行人的重要部分被遮挡时,该区域的特征仍然可以用于检测。

为了满足这些要求,我们设计了像素级校准和基于区域的校准,前者将特征图集中在行人可见和可识别的部分,而后者利用行人激活图通过引入多层次的上下文信息来选择最具识别性的区域。

根据行人激活图,像素级校准强化或抑制学习过程中的卷积特征,当行人的重要部分被遮挡时,验证上下文区域,从并发性的角度提供区分信息,例如,行人经常停留在人行道或自行车上,但很少在空中,区域校准模块可以利用上下文区域的特征更好地检测。

Pixel-wise校准 如图3所示,像素级特征校准通过像素级积运算和加法运算进行,将标定前后的特征映射记为X = {Xc},以c为通道索引,按像素进行标定操作为

其中 表示元素乘积。然后将校准后的特征插入到网络中进行其他特征计算,请注意,像素级校准是通过乘积和加法操作执行的,点乘操作将行人激活图反映的遮挡和非遮挡置信度转换为每个特征通道。

然而,鉴于行人的各种外观和杂乱的背景,行人激活图不一定准确,添加操作的使用保持了原始特征,从而平滑像素校准的效果,由于行人激活图(PAM)是通过加权和求和所有卷积特征来计算的,它结合了分类器权重和特征的判别信息,以自激活的方式突出可见的行人部分,然而,分类器本身的权重不能指示行人的可见或遮挡部分。

区域校准 给定行人激活图,可以进一步开发自适应上下文模块,以增强特征表示,实现良好的检测,如图4所示,我们首先为每个区域方案定义一个内部校准区域和一个外部校准区域。

外部校准区域定义为与区域方案相似,但高度= h r,宽度= w r的矩形,其中h和w分别为区域方案的高度和宽度,r > 1为超参数,同样,内部校准区域定义为高= h/r,宽= w/r的矩形,内部校准区域位于区域建议内,覆盖行人激活图上像素值之和最大的区域,外部校准区域覆盖区域方案,与内部校准区域具有相同的中心,标定区域的坐标是围绕区域建议进行穷举搜索确定的。

由以上定义可知,两个标定矩形的位置由行人激活图a确定,设Xr、XiA和XoA为RoI池化后的三个相同大小的特征,如图4所示,Xr和XiA均来自区域建议,但XiA内部校准矩形的特征设为0;XoA来自外部校准矩形,但将XoA内部区域建议的特征设为0,然后计算该区域方案的标定特征eX为

有两个常见的因素会导致被遮挡的行人无法被发现,首先,遮挡部分对特征引入了显著的噪声,这可能会使检测器混淆,导致分类错误,其次,可见部分的特征可能不足以识别被遮挡的行人,特别是在背景复杂的情况下。利用行人激活图作为指标,我们使用像素级和区域校准模块来增强可见部分的特征,抑制被遮挡部分的特征,提高检测被遮挡行人的机会,当行人的重要部分被遮挡时,验证上下文区域,从并发性的角度提供区分信息。

例如,行人经常停留在人行道或自行车上,但很少或空气,区域校准模块可以利用上下文区域的特征进行更好的检测,区域校准是通过空间池化函数来实现的,该函数聚集了背景区域中的特征。

通过区域标定,融合了区域特征、内部标定特征和外部标定特征,在该过程中,上下文区域内的信息不被删除,而是根据负权重进行融合,使外部区域不覆盖任何行人部分,这有利于提高行人定位精度。

4 网络结构

基于fast - rcnn框架以及所提出的SA和FC模块,我们构建了行人目标检测器FC- net,如图5所示。在检测网络的最后一个卷积层(Conv5)之后,每个区域建议的卷积特征在空间上被池化为一个具有全局平均池化(GAP)层的C维特征向量,其中C表示特征通道的数量,这样的特征向量然后转换为一类对象(行人或背景)的置信度,通过将其与全连接层的权重向量相乘,并使用软最大操作。

通过特征标定和网络学习,FC-Net的工作方式为:X W A X···,在网络的学习过程中,各种行人实例的特征被聚合到分类器权重向量W,通过SA和FC模块,利用权值向量生成激活映射A,再用激活映射A来强化或抑制特征x,FC- net通过多次迭代学习,实际上实现了一种特殊的自节奏特征学习,SA模块和FC模块叠加在一起,形成了一种通用的基于深度学习的目标检测的新架构。

所提出的SA和FC模块在没有附加参数的情况下被极度压缩,涉及到通道方面的特征校准,即,松散地说,X = A X, A = W·X,其中W借用检测网络,W参与正向过程,通过充分研究分类器中“被挤压”的高级语义信息,改进了FC-Net的特征学习过程,在特征校准过程中,语义信息被激发以激活特征图,使其能够专注于可见的行人部分,同时抑制遮挡区域。

5实验

在本节中,我们首先描述关于数据集、评估指标和实现细节的实验设置,然后,我们评估了所提出的SA和FC模块在基准数据集上的有效性,最后,介绍了FC-Net的性能以及与最先进的行人探测器的比较。

A.实验设置

数据集:两个常用数据集,Caltech和CityPersons,用于评估FC-Net。Caltech数据集包含了大约10个小时的街景视频,这些视频是由安装在车辆上的摄像头拍摄的,数据集最具挑战性的方面是大量低分辨率和被遮挡的行人,我们从set00到set05采样了42,782张图像用于训练,从set06到set10采样了4,024张图像用于测试。CityPersons数据集建立在语义分割数据集Cityscapes之上,它包含了德国18个不同的城市,在三个不同的季节和各种天气条件下,共有5,000张图像,2,975张用于训练,500张用于验证,1,525张用于测试,这个数据集比Caltech更“拥挤”,行人对象最具挑战性的方面是严重遮挡。

评估指标:为了证明FCNet在不同遮挡水平下的有效性,从CityPersons中的验证集中定义三个子集:(i)合理(遮挡< 35%,高度> 50像素),(ii)部分(10% <遮挡< 35%,高度> 50像素),(iii)重度(遮挡> 35%,高度> 50像素),通常使用在[10 2,100]的FPPI范围内计算的平均日志漏发率MR 2作为性能指标。

实现细节:基线检测网络为常用的Faster R-CNN,使用ResNet-50作为骨干网,因为它比VGG-16更快、更轻。通过使用Faster R-CNN作为基线检测网络,我们在CityPersons验证集上实现了15.18%的MR 2,这比在[10]中报道的15.4%的MR 2好得多。

FC-Net的实现细节与maskrcnn-benchmark项目一致,我们训练网络进行6k次迭代,将基础学习率设置为0.008,在CityPersons上进行5k次迭代后,学习率降低了10倍。采用随机梯度下降(SGD)求解器对8个Nvidia V100图形处理器上的网络进行优化,一个小批处理包含每个GPU一个图像,权重衰减和动量分别设置为0.0001和0.9,我们只使用单尺度的训练和测试样本( 1或 1.3)与其他方法进行公平比较。

B.自激活(SA)

在特征激活方面,挤压激励(squeeze-and-励磁,SE)是基于自注意机制校准卷积特征的最相关的工作之一,我们的SA模块与它明显不同,没有添加任何额外的参数,仅重用分类器的权重向量来增强特征学习,如图6所示,我们的SA模块比SE网络更有效地突出行人可见部分,这表明,高级语义信息对于抑制背景、增强前景至关重要。

图6c从上到下行比较了不同方法的结果,从左到右,我们展示了相同方法在不同迭代中的结果。与基线Faster RCNN(第一行)和SE network(第二行)相比,所提出的SA模块有效地突出行人区域,同时抑制了背景。

由于权重压缩了行人部分和特征通道的统计重要性,它们被用于将部分/通道聚合到一个激活映射中,该映射加强可见部分,同时抑制遮挡部分,图7显示了部分非遮挡实例和遮挡实例的行人激活图,可以看出,我们的方法可以自适应地抑制各种遮挡区域,并增强行人物体的可见部分。

C.特征校正(FC)

像素级校准:在行人检测中,背景是导致检测误差的重要因素,因此,我们建议使用背景误差来验证FC模块的效果,背景误差定义为检测结果与ground truth之间的交集over union (IoU)小于0.2。图8对比了使用特征校正前后来自背景的误差,可以看出,我们的像素级校准有效地减少了漏检和由背景噪声引起的假阳性,在图8中,蓝色曲线显示基线的背景误差非常显著,即从FPPI = 0.056到FPPI = 0.316,基线的背景误差大于70%。

通过使用我们的像素级校准模块,背景误差显著降低(黑色曲线),特别是从FPPI = 0.316到FPPI = 1.0,在FPPI = 1.0时,采用像素级校准的FCNet将背景误差从58%降低到48%,这表明,采用像素级特征校正后,背景误差被显著抑制。

在表I中,我们定量地评估了像素特征校准的效果,与基线相比,经过像素级特征校准的FC-Net在合理子集上 1.3尺度上MR 2降低了0.78%,在重度子集上MR 2降低了3.15%,在合理+重度子集上MR 2降低了1.65%。

区域校准:通过使用区域校准模块,背景误差显著降低(图8中的红色曲线),在FPPI=0.056时,经过区域校准的FC-Net将背景误差的比例从76%降低到66%,在表I中,经过区域校准的FC-Net在合理子集上 1.3尺度上MR 2减少了1.50%,在重度子集上MR 2减少了5.39%,在合理+重度子集上MR 2减少了2.75%。

通过在激活图上搜索值和最大的区域来确定内外标定矩形的位置,我们需要根据经验确定比率参数r,如表II所示,在[1.0,2.0]范围内搜索,我们发现高度r = 1.8时性能最好。

在最佳高度比下,我们进一步观察到最佳宽度比2为1.0,如表III所示。宽比小于高比的原因是提案周边区域可能存在水平方向的其他行人,这可能会混淆探测器。请注意,像素级校准不依赖于任何上下文信息,因此即使在拥挤的场景中也是有效的。

宽比和高比是用于区域标定的两个超参数,从表II和表III的消融实验可以看出,垂直方向上的上下文信息比水平方向上的上下文信息更重要,原因可能是在垂直方向上行人与背景之间有更多的并发信息,当水平方向有多个行人时,环境信息可能会受到干扰。

D.遮挡处理

为了展示所提出的SA和FC模块对闭塞处理的有效性,我们在存在显著的人对人和车对人遮挡的CityPersons验证集上评估了检测性能,在图9中,我们比较了Faster R-CNN和FC-Net对遮挡样本的检测结果,可以看出FC-Net比Faster R-CNN产生更少的误报,检测到更多的行人。

E.表现与比较

Citypersons数据集:我们在Citypersons的验证和测试集上比较FC-Net与先进的方法,包括Adapted fastrcnn,Repulsion Loss和OR-CNN。

在表IV中,在输入图像的 1.3尺度下,我们的方法在Heavy子集和Partial子集上分别实现了比OR-CNN低8.5%和1.8%的MR 2,而在Reasonable子集上保持了相当的性能,在输入图像的 1尺度下,它在Heavy子集和Partial子集上分别优于OR-CNN 8.9%和1.4%。

如表V的最后一列所示,FC-Net在Heavy子集上的MR 2优于OR-CNN高达10.29% (41.14% vs. 51.43%),在All子集上,它产生了与其他方法相当的性能。

在表VI中,我们将FC-Net与注意力引导方法fastrcnn +ATT进行了比较,后者是一种用于遮挡行人检测的最先进的方法,令人惊讶的是,FC-Net在Heavy子集上比fastrcnn +ATT高出9.87%,在Reasonable+Heavy子集上高出9.59%。

它在Reasonable子集上的性能也优于fastrcnn +ATT,我们在FC-Net框架(记为FC-Net+ATT)中实现了fastrcnn +ATT的注意力模块,发现FC-Net(我们的)的性能也优于FC-Net+ATT。

在表VII中,将所提出的区域校准模块与MS-CNN和MultiPath中的上下文模型进行比较,可以看出,所提出的模块优于它们,原因在于,我们的区域标定在行人激活图的指导下,可以根据行人激活图自适应地生成内外区域,相比之下,MS-CNN和MultiPath中的算法由于使用预定义的区域而不具有自适应能力。

在图11中,显示了CityPersons数据集上的一些检测示例,我们发现FC-Net能够准确地检测出高遮挡的行人,然而,我们也观察到一些来自低分辨率和/或遮挡区域的错误检测,假检测可能是由于检测器在训练过程中对少数硬阳性的过度拟合造成的。

Caltech 数据集:在这个数据集上,我们使用提供的高质量注释,按照常用的评估指标,在10-2到100 FPPI范围内的9点以上的对数平均漏失率被用于评估探测器的性能,我们在CityPersons上对FC-Net进行预训练,然后在Caltech 的训练集上对其进行微调,我们在Caltech 数据集的合理子集上评估FC-Net,相比其他的方法,如图10所示,FC-Net达到4.4% MR 2,在性能领先板上。

F 通用物体检测

除了行人检测外,所提出的FC-Net一般适用于其他物体检测,为了验证它,我们在PASCAL VOC 2007数据集上测试FC-Net,该数据集包含20个对象类别,为了在PASCAL VOC上实现FC-Net,我们仍然使用Faster R-CNN框架作为基线,在ImageNet上预训练的RseNet-50作为骨干网,该模型在PASCAL VOC的训练和验证子集上进行了微调,并在其测试子集上进行了评估,在表VIII中,FC-Net比基线高出1.3% mAP。特别是“aero”、“boats”、“sofa”和“train”的map分别提高了6.3%、5.9%、5.9%和4.3%,对于具有挑战性的目标检测任务来说,这是一个显著的改进,一些类别的激活图,如“自行车”,有很多“洞”,因为在对象区域内存在很多背景像素,这可能会导致背景特征的错误执行,从而降低检测性能。

G.检测效率

在表IX中,我们比较了FC-Net与Faster R-CNN基线的测试效率,由于FC-Net在检测被遮挡行人方面的优异性能,其计算开销很小,SA和FC模块在每个训练迭代中被调用一次,因此,它们的训练迭代数等于网络的训练迭代数,在推断过程中,SA和FC模块被调用一次,每个图像只增加0.042秒。

6 结论

现有的行人检测方法无法适应被遮挡的情况,同时在非遮挡的情况下保持良好的性能,在本文中,我们提出了一种新的特征学习方法,称为特征校准网络(FC-Net),用于自适应检测严重遮挡的行人,FC-net由自激活(SA)模块和特征校准(FC)模块组成,SA模块通过重用分类器权重来估计行人激活图,FC模块校准卷积特征以进行自适应行人表示,通过SA和FC模块,FC-net提高了被遮挡行人检测的性能,与最先进的方法形成鲜明对比。

它也适用于具有显著性能增益的一般目标检测任务,FC-Net背后的本质是它实现了一种特殊的自速度特征学习,它可以增强可见物体部分的特征,同时抑制遮挡区域的特征,这为行人检测和其他带有遮挡的一般物体检测提供了新的见解。

展开阅读全文

页面更新:2024-04-29

标签:遮挡   行人   卷积   特征   子集   权重   像素   模块   区域   方法   网络

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top