关键词:
水下小目标检测系统
目标检测
轻量化
图像增强
深度学习
摘要:
随着“蓝色粮仓”战略的提出和海洋牧场的兴起,对海洋资源监测和管理的自动化需求日益增长,尤其是在海参、海胆等底栖物种的生长监测与捕捞方面。传统的水下作业方式效率低下且伴随较高的风险,因此开发一种可嵌入到水下机器人的小目标检测算法以替代人工监测并提高作业效率,具有重要的现实意义。基于以上现状,本文提出了一种高效且轻量化的小目标检测模型。主要研究内容如下:
(1)针对水下图像质量低下,提出了一种水下图像增强算法
在光的吸收和散射效应下,水下图像会产生颜色偏差,细节模糊,以及整体对比度较低等现象。针对上述问题,本文提出了一种基于小波融合的水下图像增强算法。首先,提出了一种基于光衰减和统计特性的颜色校正策略,用以消除水下图像中的严重蓝绿色偏现象。接着,提出了一种基于分段最大熵的自适应全局对比度增强算法,以改善图像亮度分布不均的问题。随后,提出了一种基于加权多尺度高斯差分的细节增强算法,以增强图像中的细节纹理特征。最后,采用双正交小波分解策略得到全局对比度增强和局部细节增强图像的高频和低频分量,再通过小波逆变换重构出最终高质量的水下图像。此算法在公开数据集UIEB和UIQS上的评估指标UIQM和UCIQE分别取得了 4.73与0.67、5.13与0.63的得分。此外,将经过此算法增强后的URPC2020数据集用于目标检测模型的训练,相对于原来的mAP@0.5提高了 0.3%,验证了此算法的有效性。
(2)针对现有模型难以高效部署到边缘设备中,设计了一种轻量化检测模型
当前水下目标检测模型对水下小目标生物检测的精度低,并且模型难以高效部署至边缘检测设备中。针对上述问题,本文设计了一种名为SFESI-YOLOv8n的轻量化检测模型。首先,通过优化目标检测层,使模型在不增加参数量的前提下,能够有效检测到4×4及以上尺寸的目标,从而增强模型对小目标的检测能力。接着,将双分支架构的MLCA注意力机制引入到小目标检测层,进一步提升模型对小目标特征的关注度。随后,构建新的Faster Block结构替代C2f中的Bottleneck结构,减少多个Bottleneck层堆叠带来的冗余计算,从而降低模型计算复杂度。此外,采用无需额外定制CUDA库的DySample动态上采样替换传统的最近邻插值法上采样。DySample动态上采样机制采用多层级特征整合策略,能够在降低内存占用的同时,提升特征图生成的质量。最后,结合Wasserstein距离度量和辅助边界框原理构建新的损失函数In-NWD,有效降低了模型对目标框的位置偏差敏感性,并加速模型的收敛速度。在URPC2020公共数据集上,SFESI-YOLOv8n的mAP@0.5和推理速度分别达到了 83.7%和227帧/秒,较原模型YOLOv8n分别提高了 1.1%和9帧。相比于原模型YOLOv8n的3.0M,本文提出的模型参数量仅为1.5M,降低了 50%。此外,与主流单阶段目标检测算法(如YOLOv5s、YOLOv6n、YOLOv7n、YOLOv9t)及轻量化检测模型(如YOLO-SBL)相比,SFESI-YOLOv8n在模型轻量化、检测精度和推理速度等方面均取得了提升。这些结果验证了 SFESI-YOLOv8n模型具有较好的精确性、实时性和轻量性。
(3)设计了一种水下小目标检测系统
在硬件部分,采用了 NVIDIA Xavier TX2开发板作为SFESI-YOLOv8n模型部署的边缘设备。在软件部分,采用PyQt5搭建了可以反馈检测结果的可视化平台,便于用户操作。在模型部署的过程中,采用了 TensorRT优化加速,使模型在边缘上设备上的推理时间从45.3毫秒提升至24.3毫秒,从而实现了每秒41帧的推理速度。最终,利用搭载SFESI-YOLOv8n模型的仿生机器鱼在真实水下环境下对海参、海胆、扇贝以及海星进行了目标检测,并通过机器人与PC端在同一局域网下建立的IP地址连接,传输到PC端的可视化平台。在可视化平台界面中,用户可以实时查看目标的具体位置、类别和检测结果。此系统海洋牧场资源监测提供了有效支持,降低了人工成本。