2022-08-22-组会
2022-08-22-组会
上次组会开完后,目前比较主流的遥感旋转目标检测相关论文读得差不多了
论文总结
使用基于角度回归的检测方法=>直接解决面对
角度参数的周期性带来的 损失的不连续性 和 回归的不一致性
解决思路: 设计一些新型IOU或Loss函数去解决, 如GWD,KFIOU等
借鉴传统通用检测器的新型表示方法(如点集(reppoints),平行四边形),规避掉 损失的不连续性 和 回归的不一致性
把这种检测框的表示,从水平垂直框迁移到旋转框的表示,需要设计一系列的转换函数。
有借鉴目标检测的新型表达方式的,如Oriented RepPoint(借鉴RepPoint),效果很好
有自己设计的新型表达方式(如根据四边形偏移量), 如Oriented R-CNN, RSDet, Gliding Vertex等,其中Oriented R-CNN效果很好,其它的效果一般
还有像ATSS(SASM)这样另辟蹊径,动态设置IOU阈值划分正负样本。设计一些算法,使用超参数调整动态值。
…
目前一个好的思路可以尝试: 能否将ATSS和Oriented R-CNN结合起来,达到一个更高的mAP?
实现思路:重新设计Head、BBox Assigner等模块去把原本固定的IOU阈值给覆盖掉
目前的在做一些尝试性的实验,学习Pytorch。
论文阅读
ViT
找到一篇论文Advancing Plain Vision Transformer Towards Remote Sensing Foundation Model 武汉大学 8月10号发布的
有代码,是目前DOTA数据集上的SOTA
这篇论文主要思想是把Vision Transformer应用在遥感图像,但ViT这一块我不太了解其具体实现,这篇论文可能自己也没有理解透彻(尤其是里面Mask Image Modeling部分),所以我打算再找些相关的论文去读一读再讲。
它跟以往的基于rpn为backbone的网络模型结构完全不一样,可能能成为一个新的思路。
文本检测方向
水平文本检测、多向文本检测、弯曲文本检测,文本识别(OCR)
多向文本检测中的比较新的文章:
MOST[2021’CVPR] (A Multi-Oriented Scene Text Detector with Localization Refinement)
使用的是DCN(可变形卷积),这就回到了Oriented Reppoint中的新型表达方式了。
- 后续是否应该继续读文章找新的思路?
- 遥感旋转目标检测方向上的文章读的差不多了,该如何找适合自己方向的新的文章?
本博客所有文章均采用 CC BY-NC-SA 4.0 协议 ,禁止商用,转载请注明出处!