关键词:
深度学习
目标检测
图像分割
医疗诊断系统
YOLOv7
U-Net
摘要:
结直肠癌是胃肠道癌症中的常见类型之一,通常由结直肠息肉经过长期演变和恶化逐步发展而来。通过内窥镜检查,可以获取结直肠息肉的大小、位置及其轮廓特征,为医生提供重要的诊断依据,辅助制定治疗方案,有助于早期预防结直肠癌的发生。由于结直肠道内光线昏暗且息肉颜色和纹理与正常肠壁相似,人工检查错误率和漏检率较高。深度学习对于复杂环境的目标检测和图像分割具有良好的适用性,相比于传统方法表现出明显的优势。因此,为了提高结直肠息肉病灶检测和分割性能,便于辅助医生进行诊断,本文基于深度学习开展了以下主要工作:
(1)为有效识别结直肠道息肉的位置和病变情况,本文提出了PSM-YOLO模型。该模型以YOLOv7为基础架构,首先引入图像增强特征金字塔(Pyramid Enhanced Network,PENet)模块,使用拉普拉斯金字塔将图像拆分成不同分辨率的层次,利用细节处理模块和低频增强滤波器来强化每个尺度的特征;其次,在颈部网络引入混洗注意力机制(Shuffle Attention,SA),增强特征图的通道和空间关注能力,提升特征的表达效果;最后,将包含交并比损失函数(Complete Intersection over Union,CIo U)替换为相似比较测度损失函数(Minimum Points Distance Intersection over Union,MPDIo U)优化分类损失函数,改善了类别分类不均衡问题,并且简化了计算过程。经过实验验证,本文改进的模型展示出显著优势,检测模型在本文应用数据集的评估中各种指标都优于当前主流的目标检测算法,适用于结直肠息肉的病灶检测。
(2)为准确判断结直肠息肉的边界特征信息,本文提出了GEACU-Net模型。该模型以U-Net模型作为基础架构,首先引入一种新的特征提取方法“全局注意力跳跃连接融合”(Global Attention Skip Connection Fusion,GASCF),在特征提取模块中引入全局注意力机制(Global Attention Mechanism,GAM)处理每一层的跳跃连接信息,改变原始网络结构进行跳跃连接处的信息融合,增强对特征区域的关注;其次,在最后一个编码器后使用有效金字塔挤压注意力(Efficient Pyramid Squeeze Attention,EPSA)模块进行特征滤波,有效融合多尺度上下文特征;紧接着引入空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块以获取全局上下文信息,增强了模型对多尺度特征的捕捉能力,提高了语义分割的准确性;最后,解码过程中采用紧凑的分散注意(Compact Split Attention,CSA)模块,增强全局和局部的信息获取能力。本文模型在四个公开数据集上的实验结果表明,其在提升息肉分割精度的同时,能够更精确地刻画息肉的边缘细节,展现出模型较强的适用性和稳定性。
(3)针对上述研究内容的实际应用问题,本文基于Py Qt5框架开发了一款结直肠息肉病灶检测与分割的软件。该软件提供了直观且用户友好的交互界面,包括用户注册登录、息肉病灶检测和息肉病灶分割模型权重的导入以及初始化、计算息肉个数以及息肉大小、数据保存导出等功能。此系统将PSM-YOLO与GEACU-Net两大模型进行结合,通过先检测后分割的流程,以辅助医院医生进行更加准确的诊断。