Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection

Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection

Introduction

论文题目 :Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection

论文地址https://arxiv.org/pdf/2304.08876.pdf

论文出处 :2023’ CVPR

代码实现https://github.com/Chasel-Tsui/mmrotate-dcfl

Idea

作者的目标转移到遥感小目标检测上:

作者发现在当前有向小目标检测中,存在严重的不匹配和不平衡问题

左图prior(anchored-based: anchor & anchor-free points)和feature和instance三者之间不匹配,大概想表达的就是静态prior由于其固定的步长,限制了高质量阳性样本的上限。

右图是用retinanet计算分配给不同GT阳性样本的平均数量,,发现对于角度和尺度远离预定义anhor的GT,其上面分配的正样本数量远远低于靠近预定义anchor的GT.

据此,作者提出了一种动态由粗到细的学习方案(DCFL):

  1. 使用可变形卷积DCN得到Dynamic Prior
  2. 使用GJSD(Generalized Jensen Shannon Divergence)代替IoU来得到粗正样本
  3. 使用DGMM(Dynamic Gaussian Mixture Model)表示对象,从而获得由粗到细的标签分配

Detail

Dynamic Prior

受到DETR和Sparse R-CNN的启发,在prior中引入更多的灵活性,提出了PCB(先验捕获模块):

  • 使用了DCN(Deformable Convolution Network)来获得Dynamic Prior
  • 另外,把回归分支学习到的偏移量来指导分类分类分支的特征提取,使得两个任务更好的对齐

这一步得到Dynamic Prior

Coarse Prior Matching

替代IoU的评价指标:

在KLD(Kullback-Leibler Divergence)的基础上,使用GJSD(Generalized Jensen Shannon Divergence),其克服了KLD不对成的缺点。

在作者的工作中,α\alpha设置为0.5。

选取top K GJSD score with this gt as the Coarse Positive Samples (CPS)

这一步得到Coarse Positive Samples(CPS,粗正样本)

Finer Dynamic Posterior Matching

对于过滤得到的CPS,再采用进一步的筛选策略过滤掉低质量正样本(主要过滤掉那些离GT太远的样本)。

定义了一个PT指标(分类得分和IoU得分的线性组合),来评估正样本是真实样本的可能性:

选取top Q PT Score with this gt as Midium Postive Sample(MPS)

对于MPS与之前使用中心概率图或者是单一高斯热图作为实例表示不同,这里使用更精细的DGMM来表示实例。

DGMM由两个部分组成,一个是几何中心,另一个是对象的语义中心(相比于单一高斯热图,主要是引入了对象语义中心)。

对象语义中心是对MPS样本的位置进行平均而推到出来的:

这一步得到Finer Positive Samples(FPS)

Result

DOTA2.0

遥感小目标检测效果主要在DOTA2.0数据集上能体现出来,DCFL在这个任务上达到SOTA:

DOTA1.0

这张图没有放精度比它更高的模型,在DOTA1.0上要比Oriented-RCNN(75.87)上低一个点

其它

总结

文章当中列举的小目标检测的几个方向很有意思,有几个点我也没注意到:

  • 多尺度学习
  • 标签分配策略
  • 上下文信息提取
  • 特征图增强