Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection

Introduction

论文题目 ：Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection

论文地址 ：https://arxiv.org/pdf/2501.03775.pdf

论文出处 ：arXiv预印本南开大学-程明明团队

该文章可以看作是LSKNet的续作，两篇文章均出自【南开-程明明】团队

作者提出了Strip R-CNN，它主要基于Large strip convolutions（条状卷积），可以很好的检测各种长宽比的物体。

作者统计了DOTA数据集上的各种横纵比物体的数量，背景的条形图是实例数量，折线图是各种网络在各种横纵比物体上检测的map。可以看出来其他的网络在检测高横纵比物体上的map精度很低，换个角度来说就是提高检测这种高横纵比物体的map是一个很好的提点方式。

作者认为检测这些高横纵比物体主要有两个挑战：

高横纵比目标在一个空间维度上包含丰富的特征信息，而在另一个维度上则表现出相对稀疏的特征。传统的基于卷积神经网络的检测器大多都是在方形范围内提取输入特征图，这种方形窗口的设计大大限制了其捕捉各向异性背景的能力。
在遥感目标检测中，需要一个额外的角度参数回归。对于高横纵比的物体，角度估计的小误差也会导致预测框与GT的重大偏差。