目标检测论文《Oriented R-CNN FOR Object Detection》解读

2022-01-19 18:11 作者:深度之眼官方账号 0人读过 | 我要投稿

来源：投稿

作者：摩卡

编辑：学姐

这篇文是粉丝的投稿哦~写的简单易懂。值得大家认真阅读，借鉴一下。如果你也有稿子，可以来投给学姐，有丰厚稿费的哦！

Motivation

由于当前的旋转目标检测模型(e.g., Rotated RPN, RoI Transformer)通过引入大量不同大小、角度的Anchors以此提升旋转目标检测的性能，或者是在生成水平Anchors的基础上进行RoI Alignment从而生成更精准的Oriented Anchors. 但是上述的这些方法在预测出更精细Oriented Anchors的同时也耗费了大量的计算资源。

为了提出一个优雅且高效的旋转目标检测框架，通过本文的调查，发现主要限制当前模型速度的阶段是候选框生成阶段，所以能否设计一个简单、通用的有向候选框生成方法，用于直接生成高质量候选框呢？

本文提出了一种有向目标检测方法 Oriented R-CNN。

Method

本文提出了一个两阶段的有向目标检测方法Oriented R-CNN。Oriented R-CNN由Oriented RPN (Oriented Region Proposal Network)和Oriented R-CNN Head构成。

首先通过Oriented RPN (Oriented Region Proposal Network)生成高质量有向候选框，然后通过Rotated RoIAlign提取固定大小尺寸的特征，最后将这些特征作为有向头检测的输入，执行分类和回归。网络框架图如下所示：

Oriented RPN是在RPN网络上构建的，拓展了RNP回归分支的输出维度(由原来的4个变为6个)以此来生成有向候选框。对于每个位置的Anchor, Oriented RPN输出为(x, y, w, h,Δα , Δβ), 其中(x, y)为有向候选框的中心坐标，w, h表示有向候选框的宽和高。

(Δα , Δβ ), 表示有向候选框外接矩形顶边和右边的偏移。接下来通过Midpoint Offset Representation得到有向候选框的顶点坐标集ν={ν1，ν2，ν3，ν4}。