关键词:
目标检测
建筑图纸
YOLO
SHAI
仿射变换
PaddleOCR
摘要:
在建筑工程项目管理中,图纸审查是确保施工质量和提高设计精确度不可或缺的一环。随着建筑工程项目的复杂性和多样性不断增长,传统的手工审图方式已难以满足现代工程对高效和精准性的要求。传统审图依赖于人工检查,这不仅耗费大量时间和人力资源,而且其结果容易受到评审人员的经验水平和个人偏好的影响,从而导致评审结果的不一致性和主观性。
为解决上述挑战,本研究提出了一种结合深度学习与计算机视觉技术的智能审图方案,旨在通过自动化和智能化的方法提升审图工作的效率和准确性。鉴于当前建筑行业对图纸审查技术需求的上升趋势,以及深度学习与计算机视觉技术在目标检测、图像分类等领域的迅猛发展,本研究引入了先进的目标检测算法,以实现对建筑设计图纸中的门窗,预留洞口,柱等进行自动识别与定位,进而完成对多专业图纸一致性审查。本文的研究内容主要围绕以下几个方面展开:
(1)针对国内外关于智能审图的研究现状进行了深入分析,并总结了目前采用的目标检测方法。基于此,我们提出了一个创新性的协同式深度学习多模态建筑图纸智能审图框架,该框架旨在融合多种数据来源的优势,以提升审图的全面性和准确性。
(2)在数据集构建方面,考虑到公开可用的建筑图纸数据集稀缺以及图纸层结构复杂的实际情况,我们从互联网收集了涵盖建筑图、暖通图及给排水图在内的多样化建筑行业图纸资料。通过CAD软件实施了一系列预处理步骤,如隐藏不必要的图层和去除背景干扰元素,最终形成一套适用于实验目的的高质量建筑图纸图像数据。
(3)在模型训练阶段,选择了YOLOv11作为基础模型,并对其特征融合机制进行了优化改进。利用自制的训练集对该模型进行了训练,并借助SAHI(一种用于分割辅助超推理的技术)对建筑图纸进行了详细的解析,实现了不同专业图纸间的一致性审核,并通过仿射变换对齐图纸,从而实现多专业图纸的一致性审核。
(4)以YOLOv11与SAHI推理的结果作为文字识别的输入,采用Paddle OCR对于建筑图纸中的门窗进行统计,从而实现对门窗数量的自动统计功能。
本研究通过整合最新的深度学习技术和计算机视觉算法,开发了一个能够有效应对现代建筑项目中复杂图纸审查需求的智能系统,不仅显著提升了审图工作的效率,还极大地增强了审查结果的客观性和可靠性。未来的工作将进一步探索如何将此智能审图系统应用于更广泛的领域,以推动整个建筑行业的数字化转型和发展。