目标检测论文《Oriented R-CNN FOR Object Detection》解读
来源:投稿
作者:摩卡
编辑:学姐
这篇文是粉丝的投稿哦~写的简单易懂。值得大家认真阅读,借鉴一下。如果你也有稿子,可以来投给学姐,有丰厚稿费的哦!
Motivation
由于当前的旋转目标检测模型(e.g., Rotated RPN, RoI Transformer)通过引入大量不同大小、角度的Anchors以此提升旋转目标检测的性能,或者是在生成水平Anchors的基础上进行RoI Alignment从而生成更精准的Oriented Anchors. 但是上述的这些方法在预测出更精细Oriented Anchors的同时也耗费了大量的计算资源。
为了提出一个优雅且高效的旋转目标检测框架,通过本文的调查,发现主要限制当前模型速度的阶段是候选框生成阶段,所以能否设计一个简单、通用的有向候选框生成方法,用于直接生成高质量候选框呢?
本文提出了一种有向目标检测方法 Oriented R-CNN。
Method
本文提出了一个两阶段的有向目标检测方法Oriented R-CNN。Oriented R-CNN由Oriented RPN (Oriented Region Proposal Network)和Oriented R-CNN Head构成。
首先通过Oriented RPN (Oriented Region Proposal Network)生成高质量有向候选框,然后通过Rotated RoIAlign提取固定大小尺寸的特征,最后将这些特征作为有向头检测的输入,执行分类和回归。网络框架图如下所示:

Oriented RPN是在RPN网络上构建的,拓展了RNP回归分支的输出维度(由原来的4个变为6个)以此来生成有向候选框。对于每个位置的Anchor, Oriented RPN输出为(x, y, w, h,Δα , Δβ), 其中(x, y)为有向候选框的中心坐标,w, h表示有向候选框的宽和高。
(Δα , Δβ ), 表示有向候选框外接矩形顶边和右边的偏移。接下来通过Midpoint Offset Representation得到有向候选框的顶点坐标集ν={ν1,ν2,ν3,ν4}。

这样就在原有水平候选框回归的基础上,回归任意两条相邻边中点的偏移,就能实现有向候选框的生成。结果如下图所示:

Oriented R-CNN Head: 在此阶段本文先进行候选框调整操作,将上述提到的有向候选框的顶点坐标集ν={ν1,ν2,ν3,ν4}由平行四边形转换为矩形(将平行四边形较长的对对角线作为调整为矩形的对角线)。
然后对所有调整后的后有向候选框进行rotated RoI alignment操作,将得到的特征图作为有向检测头的输入,执行分类和回归任务。
Results: Oriented R-CNN在DOTA和HRSC2016 两个数据集上进行验证。

表1:Oriented R-CNN在DOTA数据集的结果。‡表示使用多尺度训练多尺度测试。

表2:Oriented R-CNN在HRSC2016数据集的结果。

表3:Oriented R-CNN与其他有向目标检测方法在速度方面的对比(DOTA数据集)。
由上述实验结果可以看出Oriented R-CNN是一个提升有向目标检测效率的同时还兼顾检测精度的模型。
未获得授权,不可以转载,否则将追究法律责任
—— 正文完 ——
关注学姐带你玩AI
获得更多论文解读
在这里等着你学习
