关键词:
小麦幼苗计数
局部标注
目标检测
Transformer
知识蒸馏
摘要:
小麦作为全球重要的粮食作物,其幼苗数量是衡量苗期出苗率与种植密度的关键指标。由于田间场景中幼苗形态异质与环境复杂性的耦合作用,使小麦幼苗检测面临显著挑战。近年来,基于深度学习的目标检测技术在精准农业领域取得了重要进展,为小麦幼苗的自动化检测和计数提供了新思路。然而,现有方法存在的不足主要体现在两个方面:一是传统卷积网络在多尺度空间上下文特征提取方面存在固有缺陷,在面对小麦幼苗形态异质性时,面临特征表达的瓶颈,导致在不同种植密度环境下适应能力不足,尤其在复杂田间环境中多源干扰耦合作用下,难以保持较高的检测精度;二是缺乏检测精度与计算效率的平衡处理,限制了其在资源受限环境中的实际应用。为应对这些问题,本研究通过构建多层级特征协同建模、耦合轻量化结构优化与知识蒸馏策略,开展以下研究工作:
(1)基于局部标注法的小麦幼苗数据集构建。使用全局标注法对小麦幼苗进行标注不仅会增加标注工作的复杂性,还容易导致标注数据中土壤等背景信息占据较大比例,而这种冗余的背景信息会削弱模型对小麦幼苗细粒度特征的提取能力,进而影响模型的检测精度。针对该问题,本研究基于局部标注法策略对小麦幼苗进行标注,与全局标注策略相比,局部标注策略显著降低了土壤背景信息的干扰,提高了对标注区域的聚焦度,有助于增强模型对小麦幼苗细粒度特征的提取能力;此外,局部标注策略还有效简化了标注操作,降低了因麦苗重叠和遮挡而产生的标注难度。最终构建的小麦幼苗数据集WSD(Wheat Seedling Dataset)涵盖了两个种植年度、两种主要小麦品种、三种种植密度,涉及小区实验和大田实验两类田间环境,共计6000张高质量麦苗RGB图像,为后续的小麦幼苗计数研究提供了数据支持。
(2)针对在复杂田间场景下的小麦幼苗检测面临的形态异质性特征表达瓶颈以及模型的精度与计算效率平衡问题,提出了基于高效特征提取器与坐标注意力机制的小麦幼苗检测模型TCE-YOLO(Transformer-Coordinate-attention-Efficient-YOLO)。该模型基于YOLOv8-n进行了以下关键改进:在特征提取阶段,为全面捕获并整合麦苗的局部特征、空间上下文特征以及全局特征,设计了结合深度可分离卷积、Vision Transformer和多尺度空间池化的高效特征提取器DTV(Depthwise-Transformer Vision),通过整合多层次特征表达,增强模型对复杂环境中麦苗特性的表征能力,同时减少模型参数量;在特征融合阶段,引入坐标注意力机制CA(Coordinate Attention)优化多层次特征图的空间表达能力,抑制背景干扰,并提升模型在不同种植密度下的检测精度,同时设计特征协调模块FCM(Feature Coordination Module)优化特征融合效率,降低计算复杂度;在预测阶段,采用EIo U(Efficient Intersection over Union)损失函数优化边界框回归,提升模型的定位精度和整体检测性能。实验结果表明,相较于主流的目标检测模型,TCE-YOLO在WSD数据集上表现出最优的检测性能,并且具有较低的计算复杂度。
(3)针对TCE-YOLO模型受计算复杂度约束而存在的性能瓶颈问题,提出由教师模型MPA-YOLO(Multiple periods of attention YOLO)与双阶段的知识蒸馏框架结合的增强方案。MPA-YOLO基于YOLOv8-x架构实现三重优化:特征提取阶段,通过DTV模块集成CBAM(Convolutional Block Attention Module)注意力机制,建立通道-空间双域动态权重分配机制,进一步提高模型对局部上下文信息的全局特征建模效果;特征融合阶段构建SA-CA双驱动架构,利用空间注意力SA(Spatial Attention)抑制上采样特征畸变,通过坐标注意力机制CA(Coordinate Attention),强化预测网络对小麦幼苗位置信息的敏感性;预测阶段采用EIo U损失函数维持师生模型决策一致性。双阶段蒸馏策略TDS(Two-stage Distillation Strategy)基于特征响应蒸馏FRD(Feature Response Distillation)与决策边界蒸馏DBA(Decision Boundary Distillation)实现MPA-YOLO对TCE-YOLO的性能增强。实验结果表明,MPA-YOLO在WSD-F1上的m AP@0.5达到94.3%,较基线提升11.7%;经蒸馏优化的TCE-YOLO-Distillation在保持7.8M参数量的前提下,在WSD-F1上的m AP@0.5最高达到94.1%,较蒸馏前提升3.7%,验证了该框架在小麦幼苗视觉检测