-1

Feature Pyramid Networks for Object Detection 采用 RPN 技术创建检测器,并使用滑动窗口技术进行分类。5.2部分怎么会有“非滑窗”的说法?

论文中的扩展声明: 5.2。使用 Fast/Faster R-CNN 进行对象检测 接下来,我们研究 FPN 用于基于区域(非滑动窗口)的检测器。

据我了解,FPN 在检测任务中使用滑动窗口。https://medium.com/@jonathan_hui/understanding-feature-pyramid-networks-for-object-detection-fpn-45b227b9106c中也提到了这一点 ,声明是

“FPN 提取特征图,然后馈入检测器,RPN 说,用于对象检测。RPN 在特征图上应用一个滑动窗口来预测每个位置的对象性(是否有对象)和对象边界框。 "

提前谢谢你。

4

1 回答 1

0

用于对象检测的特征金字塔网络 (FPN) 不是 RPN。

FPN 只是进行特征提取的一种更好的方法。它将几个阶段的特征结合在一起,为对象检测管道的其余部分提供了更好的特征(特别是因为它结合了第一阶段的特征,为检测中小型对象提供了更好的特征)。

正如原始论文所述:“我们的目标是利用 ConvNet 的金字塔特征层次结构,它具有从低到高层次的语义,并在整个过程中构建一个具有高级语义的特征金字塔。由此产生的特征金字塔网络是通用的,在这个论文我们专注于滑动窗口提议者(Region Proposal Network,简称 RPN)[29]和基于区域的检测器(Fast R-CNN)

所以他们用它来检查“两阶段”对象检测管道。第一阶段是 RPN,这是他们在第 5.1 节中检查的内容,然后他们在第 5.2 节中检查分类阶段。

Fast R-CNN Faster R-CNN 等是基于区域的目标检测器,而不是滑动窗口检测器。他们从 RPN 获得一组固定的区域进行分类,仅此而已。

关于您可以在https://medium.com/@jonathan_hui/what-do-we-learn-from-region-based-object-detectors-faster-r-cnn-r-fcn-fpn看到的差异的一个很好的解释-7e354377a7c9

于 2020-06-11T12:38:46.697 回答