关键词:
目标检测
脉冲神经网络
训练后量化
注意力机制
摘要:
目标检测作为计算机视觉领域的核心任务之一,其核心目标是在给定图像中精确定位并识别特定类别的物体。当前主流的解决方案主要基于传统人工神经网络,如YOLO、R-CNN等系列模型。虽然这些方法在基准数据集上取得了优异的性能,但其依赖于海量标注数据和高算力资源,相较之下,人脑在执行复杂感知与认知任务时的功耗仅约20瓦,凸显出了生物神经系统与传统人工神经网络在能效比方面上的巨大差异。在此背景下,科学家们提出了一种受生物神经机制启发的新型神经计算范式——脉冲神经网络(Spiking Neural Network,SNN)。脉冲神经网络通过离散的脉冲序列(0/1信号)进行异步事件驱动的信息传递,相比于传人工神经网络更贴近生物神经系统中的时序编码机制。此外,脉冲发放的稀疏性与事件触发特性使其在理论上具备更高的能效优势,尤其适合资源受限边缘计算场景。尽管如此,现有脉冲神经网络在目标检测任务中的应用仍存在诸多挑战:多数模型仅对神经动力学过程进行浅层建模,缺乏深层结构设计,导致特征提取与语义表达能力有限;此外,大多数脉冲神经网络的计算开销尚未在实际系统中体现出明显优势。同时,当前脉冲网络对注意力机制的建模仍不充分,未能有效发挥注意力在增强特征选择性与表示能力方面的潜力。为此,本文提出两种结构性改进,旨在提升脉冲神经网络在目标检测任务中的性能与效率:
(1)针对目标检测任务,本文设计了一种脉冲驱动检测框架,通过引入脉冲残差模块改进传统目标检测网络,使得网络更加贴近于生物神经系统中信息传递过程,显著减少了计算资源消耗的同时,加快网络的训练推理速度。此外,为了进一步降低模型计算开销,本文还创新性的引入计算友好型的训练后量化策略(PTQ),将量化参数强制限定为二进制幂级数形式,将网络中的乘除运算转化为移位操作,实现了模型存储开销和计算复杂度的双重优化。通过在标准目标检测数据集COCO上进行系统的实验验证,本模型达到了较高的检测性能,并且在较大比特率压缩的情况下,模型仍能保持与压缩前相似的精度。
(2)本文在基础框架下引入脉冲形态下的注意力机制以增强模型在目标检测任务中的性能,实现了一种基于注意力机制的SNN-YOLO(Attention SNN-YOLO)架构。通过脉冲形态下的通道注意力、空间注意力及时间注意力的协同,捕获互补的特征表征,从而提升各个注意力模块的性能。改进后的模型能够动态高效地聚焦于最具判别性的视觉特征,有效减轻脉冲编码带来的信息损失。本文通过系统性的分析与实验,验证这种多维度注意力融合机制显著提升了模型对目标特征的感知能力。此外,在NWPU VHR-10数据集上,本文模型对比了不同注意力机制所带来的性能提升,其中最高的性能提升可达11.7%。
综上所述,本文通过脉冲残差模块、注意力机制引入以及模型量化,有效提升了脉冲神经网络在目标检测任务中的表征能力与计算效率,为构建低能耗、高性能的类脑视觉系统提供了新路径。