Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection
Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection
Introduction
论文题目 :Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection
论文地址 :https://arxiv.org/pdf/2304.08876.pdf
论文出处 :2023’ CVPR
代码实现 :https://github.com/Chasel-Tsui/mmrotate-dcfl
Idea
作者的目标转移到遥感小目标检测上:
作者发现在当前有向小目标检测中,存在严重的不匹配和不平衡问题
左图prior(anchored-based: anchor & anchor-free points)和feature和instance三者之间不匹配,大概想表达的就是静态prior由于其固定的步长,限制了高质量阳性样本的上限。
右图是用retinanet计算分配给不同GT阳性样本的平均数量,,发现对于角度和尺度远离预定义anhor的GT,其上面分配的正样本数量远远低于靠近预定义anchor的GT.
据此,作者提出了一种动态由粗到细的学习方案(DCFL):
- 使用可变形卷积DCN得到Dynamic Prior
- 使用GJSD(Generalized Jensen Shannon Divergence)代替IoU来得到粗正样本
- 使用DGMM(Dynamic Gaussian Mixture Model)表示对象,从而获得由粗到细的标签分配
Detail
Dynamic Prior
受到DETR和Sparse R-CNN的启发,在prior中引入更多的灵活性,提出了PCB(先验捕获模块):
- 使用了DCN(Deformable Convolution Network)来获得Dynamic Prior
- 另外,把回归分支学习到的偏移量来指导分类分类分支的特征提取,使得两个任务更好的对齐
这一步得到Dynamic Prior
Coarse Prior Matching
替代IoU的评价指标:
在KLD(Kullback-Leibler Divergence)的基础上,使用GJSD(Generalized Jensen Shannon Divergence),其克服了KLD不对成的缺点。
在作者的工作中,设置为0.5。
选取top K GJSD score with this gt as the Coarse Positive Samples (CPS)
这一步得到Coarse Positive Samples(CPS,粗正样本)
Finer Dynamic Posterior Matching
对于过滤得到的CPS,再采用进一步的筛选策略过滤掉低质量正样本(主要过滤掉那些离GT太远的样本)。
定义了一个PT指标(分类得分和IoU得分的线性组合),来评估正样本是真实样本的可能性:
选取top Q PT Score with this gt as Midium Postive Sample(MPS)
对于MPS与之前使用中心概率图或者是单一高斯热图作为实例表示不同,这里使用更精细的DGMM来表示实例。
DGMM由两个部分组成,一个是几何中心,另一个是对象的语义中心(相比于单一高斯热图,主要是引入了对象语义中心)。
对象语义中心是对MPS样本的位置进行平均而推到出来的:
这一步得到Finer Positive Samples(FPS)
Result
DOTA2.0
遥感小目标检测效果主要在DOTA2.0数据集上能体现出来,DCFL在这个任务上达到SOTA:
DOTA1.0
这张图没有放精度比它更高的模型,在DOTA1.0上要比Oriented-RCNN(75.87)上低一个点
其它
总结
文章当中列举的小目标检测的几个方向很有意思,有几个点我也没注意到:
- 多尺度学习
- 标签分配策略
- 上下文信息提取
- 特征图增强
本博客所有文章均采用 CC BY-NC-SA 4.0 协议 ,禁止商用,转载请注明出处!