关键词:
稳定扩散模型
目标检测
文本反演
低秩自适应
钢板表面缺陷识别
摘要:
钢铁工业中,钢板作为基础性材料在国民经济建设中具有不可替代的重要地位,其在多个重要领域发挥着关键作用,包括但不限于船舶制造、汽车工业、航空航天以及轻工产品制造等。随着现代工业对材料性能要求的不断提高,钢板表面质量控制已成为制约产品质量提升的关键因素之一。在钢板加工过程中,受生产设备性能、工艺参数(如高温高压环境)、运行速度等多重因素影响,极易产生划痕、凹坑、氧化皮、裂纹、结疤、夹杂等各类表面缺陷。这些缺陷不仅会降低产品的外观品质,造成商业价值贬损,还会显著增加后续加工成本,如额外的打磨、抛光等二次加工工序。更严重的是,表面缺陷会破坏材料表面完整性,加速材料氧化腐蚀进程,缩短使用寿命,甚至可能引发重大安全事故,给企业和社会带来不可估量的损失。因此,如何有效实现钢板表面质量检测与控制,已成为钢铁行业提升产品质量的关键课题,也是当前学术研究的热点方向。
近年来,随着计算机视觉技术的快速发展,基于深度学习的检测方法在工业质检领域展现出巨大潜力。相较于传统检测技术(如涡流检测、超声波检测等),基于深度学习的图像检测方案展现出显著优势:该方案可结合非接触式传感器实现无损检测,避免对材料表面造成损伤,同时兼具检测速度快、准确率高等特点,且具有更强的缺陷特征学习能力。本研究以不锈钢钢板为研究对象,基于深度学习技术框架,从数据增强、检测算法优化和检测系统实现三个维度展开深入探究,旨在构建一套高效、可靠的钢板表面缺陷检测解决方案。具体研究内容如下:
在检测模型优化方面,本研究对YOLO11s模型进行了系统性改进:首先,在骨干网络中嵌入SCAM(Spatial-Channel Attention Module)注意力模块,通过协同整合全局特征提取与注意力机制,使网络能够更关注缺陷区域的显著性特征;其次,采用MPDIo U(Minimum Point Distance Intersection over Union)作为新的边界框损失函数,该函数通过最小点距离计算来优化边界框回归过程,以优化目标定位精度。通过上述改进,最终构建了YOLO11s-SCM改进模型。在标准缺陷数据集上的测试结果表明,该模型对六类典型缺陷的检测精度达到78.0%m AP,较基线模型有明显提升。
针对工业生产中缺陷样本稀缺导致模型泛化能力不足的问题,本研究创新性地提出了一种基于Stable Diffusion模型的微调优化策略。该方法首先采用文本反演(Textual Inversion)技术优化模型的文本嵌入空间,通过将特定缺陷特征编码到文本嵌入空间,实现文本到图像的精准控制;继而结合低秩自适应(Low-Rank Adaptation,Lo RA)方法对模型进行轻量化微调,实现生成图像与真实缺陷数据集的分布对齐。特别地,在训练过程中引入感知损失函数以提升生成图像的视觉真实性,通过VGG网络提取多尺度特征来提高图像的保真度,最终构建出SD-SSG模型。实验证明,该方法生成的合成图像不仅质量优异,在FID指标上可达到101.01,而且通过此数据增强可进一步将目标检测模型精度提升至80.3%m AP。
为实现检测系统的工程化应用,本研究设计并实现了一套完整的钢板表面检测软硬件系统。通过深度学习模型部署与图形用户界面开发,实现了检测过程的可视化管理与自动化处理。经实验,系统检测速度达到53帧/秒,充分验证了所提方法在实际应用中的有效性和鲁棒性。