关键词:
遥感图像
目标检测
微小目标
深度学习
摘要:
本文旨在研究和设计能够在保证一定精度的前提下,对微小目标进行快速检测的算法。本文中的微小目标指在800×800像素的图像中尺寸小于16×16个像素的目标,例如遥感卫星图像中的车辆或无人机航拍图像的行人等。对这类目标的检测算法可被应用于交通管制、道路规划、城市建设等多种场景,具有较高的实用价值。
受益于基于深度学习的常规目标检测的发展,面向遥感场景的微小目标检测器同样可以基于通用的检测框架构建。然而,微小目标往往具有信噪比低,特征稀少,排列密集,样本不均衡等特点,对检测器的设计造成了较多困难,如何针对以上难点设计算法成为挑战。本文将从网络结构设计和训练方式改进这两个方面,针对以上问题提出三种模块对现有的目标检测算法进行扩展和完善,以增强现有算法对遥感微小目标的检测性能,其中在网络结构改进方面,提出了组合聚焦式双路降采样模块与伪四重解耦式检测器,而在训练方式改善方面,提出了一种高斯任务对齐式样本分配器。本论文的主要研究工作如下:
(1)针对网络结构中的主干网络层,提出了一种基于聚焦结构的组合聚焦式双路降采样模块以提升算法的下采样能力,该模块基于聚焦结构中分离-组合的思想,对所输入的特征图分成四个子图,分别对子图进行不放缩的卷积,之后将四个子图所得到的特征图进行拼接,最后与来自整体图像的特征进行注意力操作并输出最终结果。相比于传统的下采样模块,该方法能够对输入图中的所有特征点进行计算,因此减少了小目标在下采样流程中的特征损失。
(2)针对网络结构的颈部结构与检测器,设计了一个由伪四层颈部网络和解耦式检测头组成的伪四重解耦式检测器。其中伪四层颈部网络在原有的特征金字塔中引入了一个虚拟的4倍降采样结构,通过将高质量的微小目标特征引入到金字塔中,并将其与辅助检测头方法组合,此方法可以允许更多的小目标特征被输入到探测器头中。而解耦式的检测器能够减少在检测头中目标位置信息与类别信息的相互干扰,从而提高特征利用效率,并有助于检测密集的小目标。
(3)针对算法在训练方式上的改善,设计了一种基于高斯建模,瓦瑟斯坦距离,KL散度和任务对齐机制的样本分配器,该分配器以检测框和实际框之间的瓦瑟斯坦距离或KL散度而非Io U及其变种作为样本分配的权重,为图像中密集的小目标提供了更加准确的匹配框,减少了目标被忽略或难以收敛的状况,从而提高了算法的检测精度,并通过此权重改善交叉熵训练损失,以提高算法在长尾类别下的检测能力。
(4)在所构建的xView车辆检测数据集上和开放获取的AI-TOD微小目标检测数据集上对所提出的算法进行实验并在精度和速度两个方面评估算法性能。实验包含两个部分:其一,对所提出的模块进行消融实验以验证每个部分对整体算法的提升情况,该实验证明了所设计的下采样结构、检测头和样本分配器分别提升了算法2.7,6.0和1.2的m AP,均对算法的检测性能有正面作用。其二,对文中所提出的算法和多个取得优秀检测性能的实时化检测器进行对比,实验证明本文的算法在x View车辆检测数据集上取得了48.4的m AP,在AI-TOD数据集上的m AP值为48.9,平均每张图像在RTX3090上的计算时间为2.2ms,在与YOLO11、RT-DETRv2算法在检测精度相近的前提下,计算速度相比YOLO11s-p2快50%,相比RT-DETRv2快100%,与多种快速检测算法相比具有更高的检测速度与性能。
(5)基于Gradio、Ultralytics与Docker框架设计了一套检测算法的可视化交互系统。首先,基于Gradio搭建了一套目标检测算法的网页界面,使得用户与研究人员能够更加方便地使用算法进行可视化实验;其次,基于Ultralytics搭建了目标检测算法的核心功能,并将检测算法与界面进行连接;最后,基于Docker对检测软件进行打包,以便于跨终端的部署。