关键词:
遥感图像处理
有向目标检测
有向目标表示
网络学习与优化
端到端检测网络
摘要:
有向目标检测技术是遥感图像解译的关键性步骤和基础性研究,同时在智能交通、智慧农业、国防监测和智慧医疗等诸多领域具有重要的理论意义和应用价值。作为水平目标检测的深化拓展,有向目标检测任务能够提供更为关键的目标方向性信息,成为了遥感图像处理领域的研究热点。然而,遥感图像中存在目标方向各异,尺度多样性,背景噪声干扰以及宽高比变化大等复杂分布特性,导致有向目标检测面临目标漏检、类别混淆、定位困难和方向预测不精准等关键性问题。研究高精度的有向目标检测模型成为计算机视觉领域和遥感技术应用的迫切需求。因此,本文围绕上述问题开展遥感图像有向目标检测理论与方法研究,以构建高精度和高效的有向目标检测模型为总体目标,从有向目标表征与特征提取、网络结构设计和网络学习优化三方面进行了研究。具体研究内容和主要创新点可概括为以下几个方面:
(1)针对遥感目标特征提取中背景噪声干扰导致的定位困难问题,开展了基于双角度旋转线对象表示的有向目标检测研究。该方法设计了一对自适应且可学习旋转线对象表示,通过灵活地组合并自适应旋转感知有向目标的方向信息。然后,构建了方向引导特征编码器,编码每条旋转线上具有判别力的目标特征,以减轻由重叠目标引起的背景噪声。同时,提出了双角度解码器独立地引导每条旋转线的,以适应有向目标的变形。基于方向引导的编码特征,双角度解码器能够引导每条旋转线的自适应旋转,进一步增强双角度旋转线目标表示的表征能力,从而提升遥感有向目标检测的平均精度均值。
(2)针对遥感目标尺度多样且有向目标检测感受野有限导致的类别混淆和漏检问题,开展了角度解耦和一致性优化策略的端到端有向目标检测网络研究。该方法首先构建了基于Transformer架构的端到端有向目标检测基线,提升网络全局上下文建模能力的同时克服对后处理机制的依赖。设计角度解耦预测模块将角度预测与边界框回归解耦,避免编码器中级联式角度预测产生的误差累计。然后,设计了角度编码一致性优化策略使用非线性函数进行角度编解码,缓解角度边界情况下不一致的匹配代价。引入查询多样性损失促进网络多样化的目标查询,从而避免冗余预测并进一步提高预测准确性。
(3)针对端到端有向目标检测难以感知遥感目标间实例级几何相关性的问题,开展了基于几何信息编码的端到端有向目标检测方法研究。该方法首先设计了几何信息编码器,通过对解码器前后层输出的预测框的角度、位置和尺寸等几何信息进行相关性建模,保留跨解码器层的几何信息先验。进一步地,设计了一个渐进式几何关系解码器,将上一层解码器的几何信息先验作为下一层解码器自注意力谱的权重。该方法为自注意力层引入跨层预测的空间位置和方向信息,促进不同编码器层预测之间的几何先验信息交互,从而更有效地捕捉目标之间的位置和方向关系。
(4)针对分类与定位任务联合优化困难的问题,开展了质量对齐匹配与优化的有向目标检测研究。该方法首先设计了质量对齐代价函数,通过分类和定位的联合表达进行一对一匹配,优先将定位质量高的样本识别为正样本。然后,利用指数函数调制定位和分类得分,并采用动态匹配策略优化样本分配。进一步地,该方法设计了质量对齐损失,以定位度量监督分类预测得分,确保分类和定位任务在训练中协同优化。质量对齐代价使高定位质量预测更易被识别为正样本,质量对齐损失则联合优化分类和定位任务,进而提升网络的训练效率和识别准确性。
(5)针对不同宽高比有向目标的角度敏感性差异导致的次优学习瓶颈问题,开展了宽高比感知优化的角度回归有向目标检测研究。该方法首先设计了宽高比自适应匹配策略,差异化调整不同宽高比目标的匹配代价,防止大宽高比预测在匹配中被过度抑制。进一步设计了宽高比自适应损失,动态调整不同宽高比预测的损失代价,避免损失计算的次优优化。同时,该方法设计了宽高比感知的角度周期性编码模块,防止角度周期性导致的角度损失突变。并根据宽高比对角度预测的匹配代价和损失进行加权,动态调节角度预测对整体匹配代价与损失的影响,进一步优化网络学习目标从而提升检测精度。