关键词:
交通场景
目标检测
异步数据融合
时序信息
在线更新
摘要:
目标检测技术基于图像或点云等数据,可以识别道路上的车辆、行人等交通参与者以及道路标志和其他环境信息,为智能交通系统和自动驾驶车辆提供了关键的环境感知数据支持。近年来,相机和激光雷达等传感器的性能提升以及大规模真实交通场景的数据采集积累,推动了目标检测的发展和应用,辅助自动驾驶日渐成熟。
但是交通场景具有天气光照多变、车流及人流密集等复杂动态特性,完全自主的自动驾驶对目标检测的性能提出了更高的要求,仅使用单一传感器进行感知存在一定的局限性,基于图像和点云融合的目标检测方法成为研究热点。然而,现有融合方法在图像信息的有效提取及利用、真实交通场景异构数据表征和异步多模态数据融合、动态交通场景自适应等方面仍然存在明显不足。
本文以图像和点云融合为核心思想,系统性解决上述交通场景目标检测存在的问题。本文的主要贡献总结如下:
1.针对交通场景目标检测中图像信息未得到有效提取及利用导致的目标类别判断错误率高及小目标检测性能差的问题,本文提出一种平衡语义和空间信息的图像目标检测方法,为后续的图像和点云融合奠定基础。具体而言,在特征连通性方面,设计了一个基于中间特征图的多尺度特征选择模块,将自上向下和直接向上采样相结合,充分提取目标语义信息的同时保留清晰的空间信息。在特征强度方面,设计了一个密集的自学习多尺度融合网络,该网络可以自动学习特征图系数,并有效地测量融合过程中不同特征的重要性。基于目标检测基准数据集KITTI、VOC、COCO进行方法对比验证了模型的有效性,可有效提升小目标检测性能。
2.引入点云信息,本文提出了一种图像和点云双向引导交互的多模态三维目标检测方法,缓解了真实交通场景异构数据表征问题及异步多模态数据融合问题。为了克服异步多模态数据中的点云稀疏性问题,设计了一种基于视觉引导和点云密度引导的目标级点云稠密化方案。针对异步多模态数据融合问题,设计了一种点云引导的图像上下文信息交互模块来增强点云特征。同时设计了一种图像引导的点云关键点交互模块,减少对目标的错误和缺失检测。基于VANJEE数据集和KITTI数据集进行了广泛的对比实验和消融研究,充分证明了提出算法的有效性。
3.引入时序信息,本文提出了一种异步注意力机制驱动的时序多模态三维目标检测方法,缓解了真实交通场景异构数据表征问题及真实交通场景的异步多模态数据融合问题。基于图像和序列点云,设计了一种双向交互的异步时序注意力机制模型,通过提取具有时空相关性的全局和局部特征,可以处理时空异步多模态数据。此外,针对研究内容二点云密度引导存在的目标位置不精确问题,结合视觉引导和光流估计,获得目标的移动范围生成虚拟点云,进一步克服了异步多模态数据中的稀疏性问题。基于VANJEE数据集和V2X-Seq数据集验证了模型的有效性。
4.从在线更新的研究角度,本文提出了一种交互式在线更新的时序多模态三维目标检测方法以适应交通场景的高动态特性。为更加全面的感知环境并减少时序目标检测计算量,基于环视视角构建时序目标特征存储库,有效避免特征的重复提取并使空间信息得到充分的利用。设计交互式在线更新机制,根据类别一致性检验及位置一致性检验,构建语义和运动引导的时间建模模块,实现交互式时序多模态融合模型在线更新。基于nu Scenes数据集验证了模型有效性,通过长序列建模可提升小目标检测性能。