关键词:
协同显著性目标检测
双分支特征学习
知识蒸馏
摘要:
协同显著性目标检测(Co-Salient Object Detection,CoSOD)任务结合了协同分割(Co-Segmentation)和显著性目标检测(Salient Object Detection,SOD),其核心难点在于如何在同一框架内同时提升这两个子任务的性能。现有方法仅依靠真值标签对模型进行训练,导致在不同应用场景下表现存在差异,模型难以平衡地提升协同分割和显著性目标检测的能力。此外,现有方法在特征建模时通常以目标整体为对象,忽视了细节特征的处理,导致在面对干扰物体时容易产生混淆,同时物体边界的分割效果欠佳。为解决上述问题,本文开展了两个工作,分别从特征学习和模型训练优化的角度出发,提升CoSOD任务的性能。
(1)本文提出了一种基于双分支特征学习的方法,旨在解决显著性目标检测中物体边界分割不准的问题,同时提升整体检测精度。该方法设计了两个分支网络,分别聚焦于学习物体的整体共识特征和边界共识特征,通过双分支结构平衡整体与局部特征的学习,有效缓解干扰物体和边界分割不精确的问题。在解码器阶段,通过概率值融合双分支的预测结果,使模型不仅能准确分割显著物体与背景,还显著提升了物体边缘信息的分割精度。为避免使用不同编码器提取特征可能导致指标提升不稳定的问题,本文采用权重共享编码器设计,既保证了训练时指标提升的相对稳定,又降低了模型的参数量。这种方法通过双分支特征学习,成功优化了边界分割精度,同时维持了整体检测的性能。
(2)为提升模型在更多场景下的检测能力,本文提出了一种基于知识蒸馏的训练方法。该方法利用两个预训练的教师模型(GCoNet+和DMT)指导学生模型(MCCL)的训练。在训练过程中,教师模型以固定权重为输入图像生成协同显著性掩码(称为软标签),为学生模型提供额外的监督信号。学生模型不仅从真实标签中学习,还通过知识蒸馏学习教师模型在多种场景下的检测能力。针对学生模型MCCL中引入的对抗学习模块,本文设计了一种自适应权重调整策略,动态调节生成器和判别器在损失计算中的权重,确保对抗训练过程生成器和判别器能够处于相对稳定的竞争状态,避免判别器在训练初期因过强而抑制生成器学习的问题,从而保障生成器能够充分优化其生成能力。
实验结果表明,本文提出的两个工作点在三个广泛使用的协同显著性目标检测数据集CoCA、CoSOD3k、CoSal2015上达到甚至超越了当前的最优性能,其中,在CoCA数据集上,Eξmax,Sα,Fβmax和ε分别提高了 2.8%,2.7%,4%和2%。