摘要
施工进度是工程项目管理的关键组成部分,传统的进度管理多依靠人工巡检,耗时费力且无法保障进度评估的时效性。为了实现施工进度的自动化、高效化监管,针对室内施工湿作业铺贴场景,提出一套智能化进度追踪与评估框架,基于改进的Mask R-CNN深度学习框架,自动提取室内墙面和地面的瓷砖铺贴进度,基于相机轨迹追踪算法,将整个施工层的大范围施工进度识别结果映射至BIM可视化模型,为施工数字孪生奠定基础。在上海市某高层建筑项目中进行实例研究,实现了施工图像的高精度分割,验证了研究框架的可行性。该框架不仅适用于室内瓷砖铺贴,也适用于抹灰、刷涂等室内装修工程。
工程项目的进度监控有助于项目管理人员及时发现并校正进度偏差,直接影响项目的成本和经济效
目前,施工进度自动化监控方式主要包括3种方式:1)基于传感器布设的进度管理;2)基于点云三维重建的进度管理;3)基于图像处理与分析的进度管理。第1种方式通过绑定施工构件与相应的二维码或RFID标签实现构件级别的进度追踪,大大降低了进度管理人员的工作
然而,现阶段基于图像识别的室内进度定量化计算方法仅能通过安装固定摄像头监控有限区域的施工进
室内连续空间施工进度智能评估框架(如

图1 技术路线
Fig. 1 Overall framework
实际墙面和地面多为矩形平面,但由于拍摄角度及镜头畸变等因素影响,相机拍摄的图片存在透视畸变,造成图像处理和进度计算误差。因此,基于Canny算子与Hough变换提出一种图像校正方法,自动消除图像畸变。
该方法主要分为3个步骤:1)直线检测。基于Canny算子和Hough变换算法得到图像中的特征边缘直线,如

图2 图像畸变校正算法
Fig. 2 Image distortion correction algorithm
注: 图(a)为原始图像,图(b)中绿色直线表示直线检测结果,图(c)中黄色直线为判断得到的边界线,红色点为角点,图(d)为校正图像
在研究场景中,存在3类主要对象,即瓷砖、混凝土(墙面未铺贴瓷砖部分所用材料)、砂浆(地面未铺贴瓷砖部分所用材料)。应用图像分割算法对3类识别对象进行分割,通过掩码计算来获取瓷砖铺贴进度。常用的分割算法包括DeepMas
Mask R-CNN算法由FPN (Feature Pyramid Networks)提取图像特征,并由RPN (Region Proposal Networks)结合图像特征提出多个RoI (Regions of Interest)。在此基础上,并行完成3个子任务,即区域分类、边界框回归和像素分割,分别得到实例的类别、准确的边界框及掩码,最终由不同颜色的掩码表征不同的实例对象(如

图3 Mask R-CNN网络结构
Fig. 3 Mask R-CNN structure
(1) |
式中:L为损失函数;为在ROI Align计算前的原特征图上的像素点;为经ROI Align计算后第r个候选区域的第j个点,与对应的在原特征图上的点记为;和为与横纵坐标的差值。当与在原特征图上的欧式距离小于1,的误差将会反向传播给。
基于图像分割的结果,通过掩码计算来获得施工进度百分比(如
(2) |
式中:P表示整施工层的瓷砖铺贴进度;i为施工层内房间序号;S为实际面积;p为像素数(像素面积);右上角标表示对象类别。
依照

图4 数据集成与进度更新
Fig. 4 Data integration and progress update
在获得所拍摄对象的施工进度和构件ID后,应用Revit API插件在BIM模型中通过构件ID进行遍历,找到唯一的墙面或地面构件并导入进度信息。在构件的属性栏中将自动显示进度完成百分比,同时在三维视图中将根据构件进度情况给构件外观赋予不同颜色进行区分。
在深度神经网络算法中,超参数和损失函数是影响算法效果的两个重要因素,其中,超参数直接影响算法的训练收敛过程,对模型性能有直接影响,而损失函数则决定了模型优化的方向,因为优化目标就是减小损失。因此,为提升模型分割精度,本研究针对本场景下数据特征单一、类别不平衡的特点从超参数优化和损失函数优化这两方面对Mask R-CNN算法进行了如下改进与提升,如

图5 算法改进试验流程图
Fig. 5 Flow chart of algorithm improvement
由于数据集的数据量不足、特征单一,在未经超参优化的情况下易发生难以收敛或过拟合问题,因此,对于算法的收敛性能要求更高。分割算法常见的超参优化器包括SGD、Adagrad和Adam等。Mask R-CNN默认采用SGD优化器,其在数据特征单一的情况下易使得参数收敛到近似的局部极小
因此,应用3种优化器分别进行试验,并以Mask R-CNN算法的默认参数实验为基准实验(baseline),结果显示(见
试验 类别 | 试验序号 | 试验内容 | 学习率 | mAP50 | mAP75 | ||
---|---|---|---|---|---|---|---|
值/% | δ/% | 值/% | δ/% | ||||
优化器 试验 | 1(baseline) |
SGD 优化器 |
2.5×1 | 97.9 | 0 | 94.6 | 0 |
2 |
2.5×1 | 97.0 | -0.9 | 93.3 | -1.3 | ||
3 |
Adagrad 优化器 |
2.5×1 | 97.6 | -0.3 | 83.3 | -11 | |
4 |
2.5×1 | 97.5 | -0.4 | 94.4 | -0.2 | ||
5 |
Adam 优化器 |
2.5×1 | N.a. | N.a. | N.a. | N.a. | |
6 |
2.5×1 | 99.4 | 1.5 | 97.7 | 3.1 | ||
损失函 数试验 | 7 | Adam+IoU losses |
2.5×1 | 88.2 | -9.7 | 54.3 | -40.3 |
8 | Adam+Dice loss |
2.5×1 | 99.5 | 1.6 | 98.6 | 4 |
注: mAP50、mAP75分别表示IoU阈值为0.5、0.75时的平均准确率,其中,δ表示相较于基准实验的提高(或降低)的数值。
Mask R-CNN算法的损失函数由3部分组成,即分类任务的损失值Loss_cls、边界框回归任务的损失值Loss_bbox、掩码分割任务的损失值Loss_mask。由于研究通过掩码计算得到具体铺贴进度,掩码分割任务的损失函数形式是影响分割精度和进度计算的关键因素。当前实例分割任务中,常用的损失函数形式包括CE Loss(如
(3) |
式中:N为图像中像素数;m为图像中的预测类别数;、分别为第i个像素属于第j个类别的真实值和预测概率。
(4) |
(5) |
Mask R-CNN 默认采用CE Loss作为损失函数,其平等考虑每个像素点的分割效
因此,分别采用IoU Loss和Dice Loss进行试验(如
将上述自动化进度评估框架在上海闵行区浦江某建筑工地(如

(a) 工地现场实景图

(b) 项目BIM模型
图6 工地现场实景图与BIM模型
Fig. 6 Construction site and BIM model
采用的硬件设备为Zed 2双目深度传感相机(如

图7 Zed 2相机及相关参数
Fig. 7 Zed 2 camera and related parameters
最终,收集到912张图像,均用labelme软件进行标注,并按照7:2:1比例将数据随机划分为训练集(638张)、验证集(184张)和测试集(90张)。
采用一块RTX3090显卡进行训练,深度学习基本环境配置为cuda11.1+cudnn8.0+pytorch-gpu1.8.0+numpy1.21.0。Mask R-CNN算法应用了在MS-COCO数据集上预训练的Resnet-101做特征提取网络,基本参数设置如下:采用Adam优化器,恒定学习率为2.5e-4,batch size为4,共训练100epoch,其余设置均采用默认参
Mask R-CNN算法应用效果如

(a) 损失函数变化曲线

(b) 准确率变化曲线
图8 Mask R-CNN算法结果
Fig. 8 The results of Mask R-CNN algorithm
通过设置校准点的方式来验证PT算法的准确度。如

图9 PT算法效果验证
Fig. 9 Validation of PT algorithm
基于室内连续空间施工进度智能评估框架,对12号楼第10层整层的瓷砖铺贴进度进行评估。
针对墙面、地面两类对象,
类别 | 墙面 | 地面 | ||
---|---|---|---|---|
拍摄方式 | ![]() | ![]() | ||
编号 | 墙面1 | 墙面2 | 地面1 | 地面2 |
原始图像 |
![]() |
![]() |
![]() |
![]() |
校正图像 |
![]() |
![]() |
![]() |
![]() |
图像分割 |
![]() |
![]() |
![]() |
![]() |
Ground truth |
![]() |
![]() |
![]() |
![]() |
进度计算 | 69% | 40% | 81% | 30% |
该项目仅有卫生间的墙面和地面,厨房墙面与阳台地面需要瓷砖铺贴,经统计第10层共有27面墙和50块地面参与计算。应用提出的框架,该项目第10层墙面瓷砖铺贴总面积为360.47
序 号 | 类别 | 构件信息 | 拍摄参数 墙面: (x,z,β,θ) 地面: (x,y,z,α,β,θ) | 铺贴 进度/% | 铺贴 面积/ | 各类铺 贴进度/% | 总铺贴 进度/% | ||
---|---|---|---|---|---|---|---|---|---|
构件编号 | 需铺贴 面积/ | 关键坐标点(x,z) | |||||||
1 | 墙面 | 1461110 | 5.945 | (-0.20,-2,25),(-0.20,-0.20) | (-1.71,-1.56,0.07,4.17) | 0 | 0.000 | 87 | 84 |
2 | 1461189 | 6.380 | (1.50,-5.50),(3.70,-5.50) | (2.72,-6.64,0.17,3.04) | 78 | 4.976 | |||
3 | 1461270 | 3.625 | (3.70,-6.85),(3.70,-5.50) | (2.54,3.87,-0.14,4.75) | 84 | 3.045 | |||
4 | 1461147 | 3.625 | (9.00,-6.85),(9.00,-5.50) | (10.04,-6.20,0.10,1.55) | 62 | 2.248 | |||
5 | 1461177 | 8.845 | (-0.20,-13.20),(-3.25,-13.20) | (-1.58,-11.78,0.07,0.17) | 100 | 8.845 | |||
6 | ... | ||||||||
1 | 地面 | 1460380 | 6.252 | (-0.20,-2.25),(-3.25,-2.25),(-3.25,-0.20),(-0.20,-0.20) | (-2.06,1.41,-1.83,4.40,-1.17,3.51) | 0 | 0.000 | 74 | |
2 | 1460276 | 2.970 |
(3.70,-6.85),(1.50,-6.85), (1.50,-5.50),(3.70,-5.50) | (2.58,1.43,-6.47,4.68,-1.27,3.12) | 12 | 0.356 | |||
3 | 1 60263 | 2.970 | (11.20,-6.85),(9.00,-6.85),(9.00,-5.50),(11.20,-5.50) | (10.23,1.40,-6.38,4.63,-1.40,3.02) | 89 | 2.643 | |||
4 | 1460167 | 6.252 | (-0.20,-13.20),(-3.25,-13.20),(-3.25,-11.15),(-0.20,-11.15) | (-1.96,1.43,13.64,4.49,-1.31,6.02) | 53 | 3.314 | |||
5 | 1460221 | 3.315 | (-7.10,-12.60),(-8.40,-12.60),(-8.40,-10.05),(-7.10,-10.05) | (-7.52,1.47,11.34,5.06,-1.48,1.57) | 100 | 3.315 | |||
6 | ... |

(a) 整层进度信息

(b) 施工完构件

(d) 未施工构件

(c) 施工中构件
图10 BIM模型进度可视化结果
Fig. 10 Progress visualization in BIM model
施工进度监控是工程项目管理的重要组成部分,传统的施工进度管理人为主观性强,自动化程度低。室内施工由于复杂的构件堆积和视线遮挡,其进度管理将耗费更多的时间和成本。以室内墙面地面瓷砖铺贴为例,提出一套室内连续空间施工进度智能评估框架。基于改进的Mask R-CNN算法自动获取施工进度百分比,并基于图像轨迹追踪算法将进度信息集成至BIM模型,为施工数字孪生奠定基础。该框架在上海某高层建筑项目中进行了实地测试与应用,实现图像高精度分割(mAP为98.6%),验证了框架的可行性。相对于现有的室内饰面施工进度评估框
1)提出了一套连续空间室内瓷砖铺贴进度自动化评估框架。通过图片畸变校正、瓷砖像素分割与掩码计算,自动获取量化的进度信息并更新集成到BIM模型。
2)提出了一种基于图像轨迹追踪技术的室内移动拍摄方法,用于自动区分与同步计算水平(地面)与竖向(墙面)瓷砖铺贴的进度,实现整个施工层的大范围施工进度监控。
研究仍存在以下局限性:
1)数据集包含瓷砖仅包含白色瓷砖,在未来工作中需要扩大数据集的瓷砖类别,并建立抹灰、刷涂等多类型施工工序数据集以提高框架的迁移性。
2)图像采集目前采用可穿戴设备巡检,未来可在综合考虑技术成熟度与成本问题的基础上,结合室内导航设备实现自动化更高的进度巡检。
参考文献
LI X, XU J, ZHANG Q. Research on construction schedule management based on BIM technology [J]. Procedia Engineering, 2017, 174: 657-667. [百度学术]
李勇. 施工进度BIM可靠性预测方法[J]. 土木建筑与环境工程, 2014, 36(4): 51-56. [百度学术]
LI Y. Analysis on predictive methods of BIM based on construction schedule reliability [J]. Journal of Civil, Architectural & Environmental Engineering, 2014, 36(4): 51-56. (in Chinese) [百度学术]
KAYHANI N, ZHAO W D, MCCABE B, et al. Tag-based visual-inertial localization of unmanned aerial vehicles in indoor construction environments using an on-manifold extended Kalman filter [J]. Automation in Construction, 2022, 135: 104112. [百度学术]
SHAHI A, SAFA M, HAAS C T, et al. Data fusion process management for automated construction progress estimation [J]. Journal of Computing in Civil Engineering, 2015, 29(6): 04014098. [百度学术]
KIM C, KIM H, RYU J, et al. Ubiquitous sensor network for construction material monitoring [J]. Journal of Construction Engineering and Management, 2011, 137(2): 158-165. [百度学术]
GOLPARVAR-FARD M, PEÑA-MORA F, SAVARESE S. Automated progress monitoring using unordered daily construction photographs and IFC-based building information models [J]. Journal of Computing in Civil Engineering, 2015, 29(1): 04014025. [百度学术]
KIM S, KIM S, LEE D E. Sustainable application of hybrid point cloud and BIM method for tracking construction progress [J]. Sustainability, 2020, 12(10): 4106. [百度学术]
黄仁, 冯阿瑞. 基于Ncut的自适应图像分割方法[J]. 土木建筑与环境工程, 2013, 35(Sup2): 107-110. [百度学术]
HUANG R, FENG A R. Adaptive image segmentation method based on Ncut [J]. Journal of Civil, Architectural & Environmental Engineering, 2013, 35(Sup2): 107-110. (in Chinese) [百度学术]
舒江鹏, 李俊, 马亥波, 等. 基于特征金字塔网络的超大尺寸图像裂缝识别检测方法[J]. 土木与环境工程学报(中英文), 2022, 44(3): 29-36. [百度学术]
SHU J P, LI J, MA H B, et al. Crack detection method based on feature pyramid network for super large-scale images [J]. Journal of Civil and Environmental Engineering, 2022, 44(3): 29-36. (in Chinese) [百度学术]
REJA V K, VARGHESE K, HA Q P. Computer vision-based construction progress monitoring [J]. Automation in Construction, 2022, 138: 104245. [百度学术]
MAHAMI H, GHASSEMI N, DARBANDY M T, et al. Material recognition for automated progress monitoring using deep learning methods [EB/OL]. 2020: arXiv: 2006.16344. https://arxiv.org/abs/2006.16344. [百度学术]
HUI L D, PARK M, BRILAKIS I. Automated brick counting for façade construction progress estimation [J]. Journal of Computing in Civil Engineering, 2015, 29(6): 04014091. [百度学术]
KROPP C, KOCH C, KÖNIG M. Drywall state detection in image data for automatic indoor progress monitoring [C]//2014 International Conference on Computing in Civil and Building Engineering. June 23-25, 2014, Orlando, Florida, USA. Reston, VA, USA: American Society of Civil Engineers, 2014: 347-354. [百度学术]
HAMLEDARI H, MCCABE B, DAVARI S. Automated computer vision-based detection of components of under-construction indoor partitions [J]. Automation in Construction, 2017, 74: 78-94. [百度学术]
ASADI K, HAN K. Real-time image-to-BIM registration using perspective alignment for automated construction monitoring [C]//Construction Research Congress 2018. April 2-4, 2018, New Orleans, Louisiana. Reston, VA, USA: American Society of Civil Engineers, 2018: 388-397. [百度学术]
DENG Y C, HAO H, HAN L, et al. Automatic indoor progress monitoring using BIM and computer vision[C]// 2017. [百度学术]
DENG H, HONG H, LUO D H, et al. Automatic indoor construction process monitoring for tiles based on BIM and computer vision [J]. Journal of Construction Engineering and Management, 2020, 146(1): 04019095. [百度学术]
PINHEIRO P O, COLLOBERT R, DOLLAR P. Learning to segment object candidates [EB/OL]. 2015: arXiv: 1506.06204. https://arxiv.org/abs/1506.06204. [百度学术]
BOLYA D, ZHOU C, XIAO F Y, et al. YOLACT: Real-time instance segmentation [C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV). Seoul, Korea (South). IEEE, 2019: 9156-9165. [百度学术]
HE K M, GKIOXARI G, DOLLÁR P, et al. Mask R-CNN [C]//2017 IEEE International Conference on Computer Vision. Venice, Italy. IEEE, 2017: 2980-2988. [百度学术]
ZHANG Q H, CHANG X N, BIAN S B. Vehicle-damage-detection segmentation algorithm based on improved mask RCNN [J]. IEEE Access, 2020, 8: 6997-7004. [百度学术]
ALLEN-ZHU Z Y. Natasha 2: Faster non-convex optimization than SGD [C]// NIPS'18: Proceedings of the 32nd International Conference on Neural Information Processing Systems December 2018: 2680-2691 [百度学术]
LYDIA A, FRANCIS S. Adagrad-An optimizer for stochastic gradient descent [J]. International Journal of Information Security, 2019, 6(5): 566-568. [百度学术]
BOCK S, GOPPOLD J, WEIß M. An improvement of the convergence proof of the ADAM-Optimizer [EB/OL]. 2018: arXiv: 1804.10587. https://arxiv.org/abs/1804.10587. [百度学术]
POLAT G, ERGENC I, KANI H T, et al. Class distance weighted cross-entropy loss for ulcerative colitis severity estimation [EB/OL]. 2022: arXiv: 2202.05167. https://arxiv.org/abs/2202.05167. [百度学术]
ZHENG Z H, WANG P, LIU W, et al. Distance-IoU loss: Faster and better learning for bounding box regression [J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(7): 12993-13000. [百度学术]
MILLETARI F, NAVAB N, AHMADI S A. V-net: Fully convolutional neural networks for volumetric medical image segmentation [C]//2016 Fourth International Conference on 3D Vision (3DV). Stanford, CA, USA. IEEE, 2016: 565-571. [百度学术]