关键词:
目标检测
水下目标检测
水下图像增强
自监督
摘要:
目标检测作为计算机视觉研究领域的关键技术,其任务目标是对图像中的目标进行定位与分类。现有的通用目标检测算法在大规模高质量的训练数据集上能够展现出优秀的检测性能。然而,当面对由光线退化、模糊等复杂水下环境导致的质量较差、标注信息稀缺的水下数据集时,通用目标检测算法的性能大幅受限。现阶段的水下图像目标检测任务主要分为两类。第一类方法是首先使用水下图像增强算法对数据集进行预处理,然后再用处理后的数据集训练通用目标检测器。这类方法的局限性在于,现有的水下图像增强算法通常以人眼视觉舒适度为优化目标,增强后的图像可能会过度曝光或引入过多噪声,虽然提升了图像的视觉效果,但损害了目标检测器的性能。第二类方法则是在通用目标检测器的基础上进行改进,通过调整网络结构或损失函数等方式,提升其在水下环境中的检测效果。然而,这类方法并未从根本上解决水下图像质量退化的问题,且改进后的目标检测器性能受限于原始通用目标检测器的架构。针对上述问题,本文提出了以下研究内容:
(1)本文针对水下图像质量退化导致目标检测性能下降的问题,提出了一种新的水下图像退化扩散自监督增强算法。该算法结合Koschmieder光照散射降质模型与扩散模型的微分思想,模拟真实水下环境的退化过程,生成自监督训练数据,避免了传统方法对人工标注数据的依赖。通过ResNet50主干网络提取图像特征,并行预测全局背景光和传输率,利用物理公式逆向恢复清晰图像。本文还提出了传输率一致性损失、背景光一致性损失和重构损失,构建无监督优化目标,确保模型训练的准确性和稳定性。该算法不仅能够有效去除水下图像中的雾化效果,还能恢复场景的细节信息,显著提升图像质量。该方法对比其他增强方法,在DUO水下目标检测数据集取得mAP50为85.2%和RUOD数据集mAP50为84.4%的突出效果。
(2)为进一步提升目标检测效果,本文提出了增强模型与通用目标检测器的联合训练机制,引入平衡权重分配策略,根据图像恢复阶段调整增强损失与检测损失的权重,实现端到端的协同优化。在训练过程中,模型通过前向退化过程生成多级伪标签数据,并在反向恢复过程中逐步恢复图像质量。通过平衡权重机制,模型在早期阶段侧重增强网络的优化,后期阶段则强化目标检测器的训练,确保增强与检测任务的平衡。实验结果表明,通过联合训练,该方法在DUO和RUOD两个公开的水下目标检测数据集上显著提升了通用目标检测的性能,其中mAP50最多提升3.6%,mAP50:95最多提升2.4%。