Feature Pyramid Networks for Object Detection
arxiv链接:https://arxiv.org/pdf/1612.03144v2.pdf
- 网络结构示意图
- 核心思想是,高级语义信息在靠后的feature map,但是分辨率太小,导致小物体的特征几乎没有了,分辨率高的feature map因为太浅又没能提取到足够用于detection的feature。所以通过这种结构能够使得分辨率高的同时又能有足够高级的语义信息。
- 利用FPN结构的RPN网络能够在上图右边的多个scale的feature map放进不同scale的anchor,从而将不同scale的anchor分开在不同分辨率的feature map上
- 其它一些细节是,这个FPN的左边是在ConvNet上改的,把每次feature map变小前的最后一层向右连接。左边最上面的用一个3x3conv生成右边最上面的图。
- 此外,作者还将FPN用在了segmention和fast rcnn上,但是我没看