关键词:
水下目标检测
YOLOv5
特征增强
轻量化
注意力机制
摘要:
海洋生物目标检测技术对于水下机器人捕捞作业具有重要意义,其不仅能使捕捞更加高效,也更加安全。近年来,基于深度学习的目标检测算法已经相对成熟,但在面对水下检测场景时,仍存在一些不足。例如,水下图像模糊、对比度低,易与背景混淆,目标尺度差距较大,在检测中易出现漏检和误检的问题。此外,基于深度学习的目标检测网络具有较高的复杂度和计算量,导致其训练好的模型在计算能力受限的移动设备上难以部署。针对以上两类问题,本文以YOLOv5为基础模型展开以下两方面的研究:
针对水下场景中目标与背景易混淆、多尺度目标特征提取困难等问题,本文提出了一种基于多尺度感知与表征增强的海洋生物目标检测算法,并训练了一个轻量化模型YOLO-MOD-N和更大的模型YOLO-MOD-S。该算法的第一个创新点在于提升了深度学习检测模型对水下多尺度目标的感知能力。首先,将全维动态卷积作为注意力机制嵌入到深层网络中,以提高网络对水下大尺度目标的敏感性。对于水下小尺度目标,设计了一个信息保留下采样模块,以减少严重信息丢失的影响。然后,在浅层网络中引入了上下文Transformer作为注意力机制,以增强网络从小目标中提取特征的能力。该算法的第二个创新点是设计了一个水下空间金字塔池化模块,以增强模型的表征能力。此外,本文还设计了一个轻量级解耦头,以消除分类与定位之间的冲突。在URPC数据集上的消融实验表明,与基准模型相比,所提模型YOLO-MOD-N在精度指标mAP@0.5上提高了2.3%,在mAP@0.5:0.95上提高了4.5%。与其他主流目标检测算法和水下目标检测算法相比,所提算法YOLO-MOD-S的mAP@0.5值为最高的85.9%,mAP@0.5:0.95值为50.2%,位列第二。
受制于水下环境的限制,水下探测设备往往不具备充分的存储和计算资源,这使得基于深度学习的海洋生物检测模型存在难以在边缘设备部署和检测效率低的问题。因此,本文从网络模块轻量化、模型剪枝以及知识蒸馏三个角度出发,逐步对前文所提的海洋生物检测模型进行轻量化改进,提出一种基于组级别剪枝和知识蒸馏的轻量级海洋生物目标检测算法YOLO-PDFM,以实现海洋生物的准确、高效检测。首先,本文设计了一种轻量级的特征提取模块C2-Faster以替代YOLOv5中的C3模块,使模型在保持精度的同时,提高模型检测速度;然后,本文对模型进行组级别剪枝,通过网络层之间的依赖关系进行分组,并通过稀疏训练和参数的相对重要性分数进行剪枝,减少模型的参数量和计算量;最后,本文对剪枝后的模型进行知识蒸馏,在不增加计算开销的前提下,提升模型的检测精度。消融实验表明,本文所提算法可以在尽可能保持精度的前提下,根据需求,成比例地减少模型的参数量和计算量,例如YOLO-PDFM(2.0×)代表着通过剪枝算法减少了约50%的参数量和计算量,并经过知识蒸馏的海洋生物检测模型。对比实验表明,在URPC数据集上,与其他常规目标检测算法和海洋生物目标检测算法相比,本文所提模型YOLO-PDFM(2.0×)是轻量的,且具备较高的检测精度。