RSDet

RSDet

Introduction

论文题目 :Learning Modulated Loss for Rotated Object Detection

论文地址https://arxiv.org/pdf/1911.08299v3.pdf

论文出处 :2021’AAAI

代码实现 :MMRotate

Idea

四边形检测,直面顺序标签问题

Detail

Quadrilateral detection

四边形检测需要考虑顺序标签点的问题:

举一个简单的例子,如果一个四边形的ground-truth是(x1,y1,x2,y2,x3,y3,x4,y4)并且所有的ground-truth并不是按一定规则顺序标注的,那么检测器有可能给出的预测结果是(x2,y2,x3,y3,x4,y4,x1,y1)。其实这两个是框是完全重合的,只是标注点的顺序变化了但是网络训练算损失的时候并不知道,它会按对应位置计算损失,此时的损失值并不为0甚至很大。

RSDet

RSDet使用的是非常直白的(x1,y1,x2,y2,x3,y3,x4,y4)(x1,y1,x2,y2,x3,y3,x4,y4)八参数表示法,描述了四边形的四个顶点坐标。

解决四边形检测的顺序标签点问题:

其主要步骤是先确定最左边的点(如果水平矩形的话有两个点满足取上面的那个)。然后通过向量叉乘找到对角点,也就是第三个点。最后利用这两个点构成的向量以及叉乘方法,根据顺序的要求(逆时针或者顺时针)找点其他两个点。

边界问题

蓝色预选框到实际位置的回归过程。绿色真实框为{(a→a) , (b→b) ,(c→c), (d→d)} ,但显然理想的回归过程应为{(a→b),(b→c),(c→d),(d→a)}。这种情况也导致模型训练困难和回归不平滑。


作者设计了旋转损失的八参数版本,由三个部分组成:
①将预选框的四个顶点顺时针移动一个位置;
②保持预选框顶点的顺序不变;
③将预选框的四个顶点逆时针移动一个位置;
④在上述三种情况下取最小值

Result

作者使用RetinaNet进行有关实验。另外,作者得出八参数比五参数更容易回归。