Gliding Vertex

Gliding Vertex

Introduction

论文题目 :Gliding vertex on the horizontal bounding box for multi-oriented object detection

论文地址https://arxiv.org/pdf/1911.09358v2.pdf

论文出处 :2020’TPAMI

代码实现 :MMRotate

Idea

四边形检测,Gliding Vertex是通过学习四个点在非旋转矩形上的偏移来定位出一个四边形来表示一个物体。但具体来说不是直接回归四边形的四个顶点,而是回归四个长度比(这四个长度比反应了每个对应测的相对滑动偏移量)。额外引入了一个倾角因子r去指导应该进行水平检测还是定向检测。

Detail

Quadrilateral detection

四边形检测需要考虑顺序标签点的问题:

举一个简单的例子,如果一个四边形的ground-truth是(x1,y1,x2,y2,x3,y3,x4,y4)并且所有的ground-truth并不是按一定规则顺序标注的,那么检测器有可能给出的预测结果是(x2,y2,x3,y3,x4,y4,x1,y1)。其实这两个是框是完全重合的,只是标注点的顺序变化了但是网络训练算损失的时候并不知道,它会按对应位置计算损失,此时的损失值并不为0甚至很大。

Gliding Vertex

除了有水平矩形框的基本标签(x,,y,w,h)(x,,y,w,h),还额外增加了(α1,α2,α3,α4)(\alpha_1,\alpha_2,\alpha_3,\alpha_4),另外还额外引入了一个倾角因子rr.

α\alpha长度比反应了每个对应测的相对滑动偏移量,rr则是四边形框与其对应水平框的面积比。

Gliding Vertex文章通过改变框的表示方式避免了上述四边形检测的标签排序问题。

Network

整体的网络结构就是Faster R-CNN,并且后续的损失函数也没有进行创新。