2023-03-06-组会

其它方式的缺点

Oriented R-CNN

最主要的缺点就是第一阶段生成的是平行四边形,而不是矩形:

  • RRoI Align只能提取倾斜矩形框的特征,并不能提取倾斜平行四边形特征,
    因此需要后处理(延长较短对角线)来转换成旋转矩形

  • 第一阶段RPN阶段的bbox是六参数的表达方式(x,y,w,h,Δα,Δβ)(x, y, w, h, \Delta\alpha, \Delta\beta)
    第二阶段RCNN阶段的bbox参数表达回归到了五参数的表达方式(x,y,w,h,θ)(x, y, w, h, \theta)
    这种不一致性会使检测器混淆学习过程中两个阶段之间的不同bbox回归方式。

  • RPN阶段形成的proposal bbox 和 RCNN阶段形成的predict bbox,其角度是不一致的

    RPN阶段会计算loss, RCNN阶段也会计算loss
    那么计算loss时,角度不一致的导致loss收敛始终会有瓶颈:
    比如假设第二阶段pridect bbox的θ\theta与GT的完全相同,那么第一阶段proposal就会有这个Δ\Delta的偏差

    当然第二阶段也会有bbox regression,对角度有进行一个微调,可能会使得最终二者Δ\Delta很小

QPDet

  • 弧度制
    计算loss的时候需要把GT(x,y,w,h,θ)(x, y, w, h, \theta)先转化到(x,y,r,Δα,Δβ)(x, y, r, \Delta\alpha, \Delta\beta)
    那么把θ\theta 转为弧度制后会有精度损失,而且Δα\Delta \alpha偏移量也是在(π2,π2)(-\frac{\pi}{2},\frac{\pi}{2}),带π\pi也会有精度损失

作者用的是{1:1 , 1 : 2, 1 : 4}的水平anchor,是怎么得到这个圆的,这个还太没搞明白

我们方式的优点、缺点

优点

不需要任何的后处理(without any postprocessing),直接生成的就是矩形

  • 如果也同样是设计这种两阶段的检测器,我们的bbox表达方式在两个阶段都是一致的,第二阶段的回归起点直接就是第一阶段生成的proposal的顶点。

缺点

0°和90°的边界情况的表示: 0°和90°只能表示成正方形…,可能是一种不足

其实不算什么缺点,因为像其它的表达方式,其边界情况也是一个正方形。

  • 如果设计成两阶段检测器,这只是第一阶段的proposal而不是最终的predict bbox,到第二阶段bbox regression会再精修一次
  • 如果设计成一阶段检测器,就再加一个bbox refine模块