基于压力容器裂纹图像检测及识别算法研究

引用本文

张天峰, 冉秉东, 王楷. 基于压力容器裂纹图像检测及识别算法研究[J]. 重庆大学学报, 2022, 45(7): 103-111. DOI: 10.11835/j.issn.1000-582X.2022.07.011.

ZHANG Tianfeng, RAN Bingdong, WANG Kai. Image detection and identification algorithm of pressure vessel cracks[J]. Journal of Chongqing University, 2022, 45(7): 103-111. DOI: 10.11835/j.issn.1000-582X.2022.07.011.

基金项目

国家自然科学基金联合资助项目(U1813216)；重庆市自然科学基金资助项目(cstc2021jcyi-msxm4008);河南省科技厅基本科研业务费支持项目(2021KY08)

通信作者

王楷，副教授，博士生导师，(E-mail)Kaiwang@cqu.edu.cn

作者简介

张天峰(1963—)，男，主要从事压力容器、管道、锅炉安全检测方向研究，(E-mail)13839216180@163.com。

文章历史

收稿日期: 2022-03-12

Contents Abstract Full text Figures/Tables PDF

基于压力容器裂纹图像检测及识别算法研究

张天峰 ¹, 冉秉东 ², 王楷 ²

1. 河南省锅炉压力容器安全检测研究院，河南鹤壁 450016;
2. 重庆大学自动化学院，重庆 400044

收稿日期: 2022-03-12

基金项目: 国家自然科学基金联合资助项目(U1813216)；重庆市自然科学基金资助项目(cstc2021jcyi-msxm4008);河南省科技厅基本科研业务费支持项目(2021KY08)

作者简介: 张天峰(1963—)，男，主要从事压力容器、管道、锅炉安全检测方向研究，(E-mail)13839216180@163.com.

通讯作者: 王楷，副教授，博士生导师，(E-mail)Kaiwang@cqu.edu.cn.

摘要: 压力容器作为一种特种设备，其安全越来越受到重视。为了保障其安全运行，选择压力容器裂纹图像为研究对象，构建检测及识别算法模型。针对算法模型在实际部署时受到内存空间、处理器计算能力等多方面硬件条件的制约问题，提出了基于NewEfficientNet-B0的轻量化方法，结果表明算法模型降低模型参数数量达78%。针对微小裂纹图像识别难度较大问题，提出了改进多尺度预测的方法，测试数据集上达到了81%的检测识别准确率。

关键词: 压力容器 NewEfficientNet-B0 多尺度预测图像检测

Image detection and identification algorithm of pressure vessel cracks

ZHANG Tianfeng ¹, RAN Bingdong ², WANG Kai ²

1. Henan Province Boiler and Pressure Vessel Safety Inspection Institute, Hebi, Henan 450016, P. R. China;
2. School of Automation, Chongqing University, Chongqing 400044, P. R. China

Supported by the National Natural Science Foundation of China (u1813216), Natural Science Foundation of Chongqing (cstc2021jcyi-msxm4008) and Basic Scientific Research Business Cost Support Project of Henan Science and Technology Department (2021ky08)

Abstract: As a kind of special equipment, the safety of pressure vessels attracts more and more attention. To ensure their safe operation, using the pressure vessel crack image as the research object, this paper constructed an algorithm model for the crack detection and identification. Generally, the algorithm model is constrained by various hardware conditions, such as memory space and processor computing power during actual deployment. Therefore, a lightweight method based on NewEfficientNet-B0 was proposed. The results show that the algorithm model reduces the number of model parameters by 78%. To deal with the difficulty of recognizing tiny crack images, an improved multi-scale prediction method was proposed. The detection and recognition accuracy rate of 81% was achieved on the test data set.

Keywords: pressure vessel NewEfficientNet-B0 multiscale prediction image detection

压力容器是一种承压类特种设备，它承载着巨大压力且相当广泛，一旦发生爆炸或泄漏往往会引起火灾、中毒等灾难性事故，给人民生命财产和环境造成严重损害^[1]。但是它又是现代化工业必不可少的生产设备，许多关键性的工艺流程更需要一些特殊的压力容器来保证运行，压力容器承受各种不同压力，包括恒定的压力、变化的压力或交替变化的压力，有些还有附加的温度或机械应力，因此容易由于压力问题导致容器产生裂纹。压力容器裂纹的检测及识别直接影响压力容器的安全运行，传统人工检测不仅影响工厂的加工生产，而且检测效率低下、准确率不高，因此实现压力容器裂纹的自动化检测及识别成为现代化工业领域的一个重要任务。

压力容器裂纹的检测及识别方法主要有：1)基于传统图像处理检测及识别；2)基于深度学习的检测及识别；3)基于超声波的检测及识别。在传统图像检测识别方面，基于真实裂纹像素始终比周围环境暗的假设，阈值分割法简单高效及计算速度快的优点，Oliver等人对裂纹检测分为2个阶段，并使用2个不同级别的阈值来检测裂纹^[2]。R.Kapela等人利用梯度直方图的方法对裂纹进行分割，然后利用SVM对其进行分类^[3]。D.Ai等人提出基于SVM算法和概率生成模型融合的算法来检测裂纹^[4]。在深度学习检测识别方面，H.Maeda等人利用SSD来检测裂纹^[5]。Li等人使用了一种叫做OLCMNet轻量级卷积神经网络，用于在有限的计算预算下检测驾驶员的注意力分散^[6]。Yang等人在HED网络的基础上引入了特征金字塔模块和自上而下的体系架构来检测裂纹^[7]。J.Cheng等人采用Unet网络来检测裂纹任务^[8]。在超声波检测识别方面，马桂振等人利用超声检测方法来研究检测锅炉裂纹信息^[9]。JH.Jang等人采用高重复率脉冲激光器和高速激光多普勒测振仪来产生非线性交互超声波^[10]。R.Wang等人提出了基于裂纹波相互作用的非线性超声技术来研究疲劳裂纹，以此来检测金属材料在长期使用下出现的疲劳裂纹^[11]。

以上方法在裂纹检测识别中取得了不错效果，但还存在很多问题：超声波方法需要操作者具备相应的先验经验和知识，否则难于实现缺陷的检测，该方法要求较高、较难推广；传统图像方法易受到噪声干扰，稳定性差、自适应能力差；深度学习方法利用神经网络自己学习数据的特征，可以提取压力容器裂纹图像更深层次特征，更加准确定位和分类压力容器裂纹。虽然深度学习算法要求相对较高，但以其识别精确度高、识别效率高和应用范围广等优势，受到了许多研究学者的喜爱。因此笔者选择压力容器裂纹图像为研究对象，采用深度学习方法实现压力容器裂纹的自动检测及识别。

图像的检测及识别常用深度学习模型有Faster R-CNN和YOLO模型。Faster R-CNN识别准确率高但存在模型复杂、检测速度慢等问题，YOLO把检测问题转换为回归问题，运行加快但存在精度欠佳。在研究中将YOLO v3主干网Darknet-53替换成为NewEfficientNet-B0以此减少模型的参数量和存储空间进而降低算法模型的复杂程度，并且增加一个104x104的特征图以此提升检测识别准确率。

1 基于深度学习压力容器裂纹检测及识别方法 1.1 卷积神经网络

卷积神经网络是一种深层人工神经网络。相较于人工神经网络，它具有局部连接、共享权重2种特性。卷积神经网络组成主要包括卷积层、池化层、激活层、全连接层。最重要的卷积层也叫特征提取层，卷积层通过不同的卷积核卷积前一层, 每个卷积核对应一个提取特征, 与前一层的感受连接。卷积核共享网络权重, 每个卷积核提取有限的信息, 因此通常使用多个卷积核来获取更多特征^[12]。

1.2 卷积神经网络模型

1) 卷积神经网络已经形成了很多成熟的网络模型，经典的如AlexNet、VGGNet、GoogleNet、ResNet和DenseNet等。在目标检测领域，杨祖莨等人直接使用卷积神经网络实现隧道内停车检测^[13]；何育欣等人使用VGGNet进行熊猫面部检测^[14]。基于经典的卷积神经网络基础上，出现了更加优秀的检测算法模型。Ren S等人设计出基于候选区域的深度学习目标检测算法Faster-R-CNN^[15]。Redmon J等人在2016年提出基于回归的目标检测算法YOLO v1(you only look once), 实现了目标识别与定位的统一^[16]。之后经过Redmon等人继续研究，先后提出改进版本YOLO v2^[17]和YOLO v3^[18]，准确率得到了进一步提高。

2) Faster-RCNN: 是由微软Shaoqing.Ren等提出。他们设计了一种区域建议网络RPN来生成建议区域，它和检测网络共享全图的卷积特征，使得区域建议检测几乎不花时间。

3) YOLO v1:其总体思想是输入图像被划分成SxS的网格，如果一个目标的中心点落在某个网格中，那么这个网格就负责这个目标的检测。

4) YOLO v2: 针对YOLO v1的不足，主要有以下几点改进：①缩减网络；②利用区域生成网络(RPN网络)来得到候选框；③使用K-means聚类算法得到更加符合数据集的锚框；④删除了全链接层和最后一个pooling层，使得最后的卷积层可以有更高的分辨率；⑤设计出全新的骨干网络Darknet-19。

5) YOLO v3:使用新的Darknet-53网络作为基础网络，Darknet-53引入了ResNet^[19]网络的残差结构以减少深层网络的训练。

2 基于NewEfficientNet-B0-YOLO v3算法压力容器裂纹检测模型

算法的具体改进分为2个部分。1)更换YOLO v3原有主干网络Darknet-53替换成为NewEfficientNet-B0以减少模型的参数量和存储空间；2)改进多尺度预测，增加了一个104x104特征图，方便对细小裂纹检测。改进后YOLO v3的检测网络结构图如图 1所示。

图 1 改进YOLO v3检测网络结构图 Fig. 1 Improved YOLO v3 detection network structure

2.1 基于NewEfficientNet-B0的轻量化方法

算法模型要部署在小型移动设备或嵌入式设备上，会受到内存空间、处理器计算能力等多方面条件的制约，因此精简模型和降低模型的参数量以减少其存储空间和计算消耗成为一个关键技术问题。对于缩小网络模型尺寸目前有2种思路：1)改变当前已有的网络结构，直接设计一种新的轻量级基础网络结构；2)以目前正在使用的骨干网络基础上，利用模型剪枝等各种削减参数的方法，压缩模型大小得到衍生的轻量级基础网络结构。选择1)提出了一种基于NewEfficientNet的轻量化方法来对算法模型进行精简、压缩，以便减少所需的存储空间和计算资源。

2.1.1 改进算法检测模型的轻量化方法

Mingxing Tan等人提出了EfficientNet网络结构, 通过使用神经网络搜索设计得到的新型卷积神经网络模型^[20]。笔者使用EfficientNet系列模型中最小的EfficientNet-B0来替换传统YOLO V3中的Darknet-53作为骨干网络。但是在使用EfficientNet-B0替换Darknet-53之前，需要对原EfficientNet-B0做出一点修改，修改后的EfficientNet-B0网络结构如表 1所示。

表 1 修改后的EfficientNet-B0 Table 1 Modified EfficientNet-B0

2.1.2 移动翻转瓶颈卷积

MBConv其实就是MobileNetV3网络中的InvertedResidualBlock。不同的是一个是采用的激活函数不一样，EfficientNet的MBConv中使用的都是Swish激活函数，另一个是在每MBConv中都加入了SE(queeze-and-Excitation)。MBConv结构如图 2所示。

图 2 MBConv结构 Fig. 2 MBConv structure

2.1.3 SE通道注意力机制

EfficientNet模型中的核心组成结构为移动翻转瓶颈卷积(MBConv, mobile inverted bottleneckconvolution)模块，该模块引入SENet(Squeeze-and-Excitation Networks)^[21]中SE通道注意力机制，增强通道关联信息的提取能力。SENet模块如图 3所示，它在旁路中调整每个通道的权重，根据不同的数据集和任务环境提升或减少不同通道的重要性。SENet的核心思想在于通过网络根据loss去学习特征权重，使得有效的feature map权重大，无效或效果小的feature map权重小的方式训练模型达到更好的结果。SEblock嵌在原有的一些分类网络中不可避免地增加了一些参数和计算量，但是在效果面前还是可以接受的。SEblock并不是一个完整的网络结构，而是一个子结构，可以嵌到其他分类或检测模型中。在这种结构中，Squeeze和Excitation是2个非常关键的操作。

图 3 SE模块的示意图 Fig. 3 Schematic diagram of SE module

2.2 改进多尺度预测方法

YOLO v3系列算法借鉴了FPN结构，融合了3个不同尺寸的特征图，为了提高了对于微小裂纹的检测精度。因此把输出的张量扩增到4个尺度，改进后的特征图结构如图 4所示，改进部分为红色部分。52×52尺寸的特征图经过上采样后和104×104尺度进行拼接，融合之后作为第4个尺度输出。改进后的YOLO v3将网络中4个检测层的特征图分别划分为104×104，52×52，26×26，13×13每个检测层提供了3种不同尺寸的anchor。

图 4 改进特征图结构 Fig. 4 Improved feature map structure

2.3 边界框预测与分类

在算法检测识别过程中，首先将输入的压力容器裂纹图像处理成为416像素x416像素，然后再将压力容器裂纹图像划分成为4个SxS的网格。最后每个单元网格负责检测落入其中心的裂纹，同时输出多个预测框及其置信度。每个边界框包含参数(t^x, t^y, t^w, t^h, t^c), 其中(t^x, t^y)为候选框的中心坐标，(t^w, t^h)为候选框的中心点。C为置信度。在位置预测上，假设Anchor Box设置在每个网格单元的左上角，坐标位置为(c^x, c^y)，宽度和高度为(p^w, p^h)，最终生成的预测坐标为(b^x, b^y, b^w, b^h)，其公式为

$ b_{x}=\sigma\left(t_{x}\right)+c_{x}, $

(1)

$ b_{y}=\sigma\left(t_{x}+y\right), $

(2)

$ b_{w}=p_{w} e^{t^{w}}, $

(3)

$ b_{h}=p_{h} e^{t^{h}}, $

(4)

其中：(b^x, b^y)为预测边界框的中心坐标；(b^w, b^h)为预测框的高度和宽度。在输出多个预测框之后，将抛弃掉置信度低的预测框并通过非极大抑制获得裂纹位置。

笔者采用Logistics分类器。假设训练样本集合X={x₁，x₂，x₃，…}, 其中样本x_i由一系列的属性表示即x₁=(a₁，a₂，a₃，…)，样本中的类别为0或1。引入参数θ=(θ₁，θ₂, ₃，…)，那么logistics函数公式为

$ h_{\theta}(x)=\frac{1}{1+e^{-\theta T_{x}}} $

(5)

若h_θ(x)>0.5则分类为1, 即属于压力容器裂纹图像。如h_θ(x)＜0.5则分类为0，即不属于压力容器裂纹图像。

3 实验分析 3.1 压力容器裂纹数据集构建

数据来源于河南省锅炉压力容器安全检测研究院鹤壁分院，经过数据扩充之后，部分数据集如图 5所示。

图 5 压力容器裂纹图像数据集 Fig. 5 Pressure Vessel Crack Image Dataset

3.2 实验环境及配置

针对基于压力容器裂纹图像检测及识别实验，具体实验环境配置如下所示：

1) 操作系统：Ubuntu16.04操作系统；

2) 编译器：Pycharm2020；

4) 内存：1T；

5) 显卡为：RTX2080Ti；

6) 显存容量：12 GB；

7) 编译语言：Python 3.7.5。

3.3 评价指标 3.3.1 mAP

平均精度AP是以召回率为横坐标，准确率为纵坐标，得到的曲线(又称P-R曲线)，AP值为P-R曲线下方的面积值。AP代表每个类别的测试模型的性能，而mAP代表所有类别的测试模型的性能，这是所有AP的平均值。mAP公式为

$ \mathrm{mAP} = \frac{1}{n}\sum\limits_{q \in R} {AP(q){\rm{ }}}。$

(6)

3.3.2 检测速度

算法模型对一幅压力容器裂纹图像检测识别的所花费多少时间。

3.3.3 参数数量

算法模型的参数数量。

3.4 实验结果 3.4.1 算法模型主要实验参数表

改进YOLO v3模型主要设置参数细节如表 2所示。

表 2 算法模型主要实验参数表 Table 2 The main experimental parameters of the algorithm model

3.4.2 压力容器裂纹图像检测及识别效果

部分压力容器裂纹的检测及识别效果如图 6所示。

图 6 检测识别效果图 Fig. 6 Detection and recognition effect diagram

3.4.3 不同算法模型loss

对于每个网络模型在300个批次训练过程当中，保存其所有的loss值，在1 820训练集当中以7∶3作为训练和验证，每1个batch size存一次loss则获得300*40个loss值，再对loss值进行可视化，不同算法模型的loss曲线对比如下图 7所示。

图 7 loss图 Fig. 7 loss diagram

3.4.4 算法模型测试结果与分析

在本次实验中使用780张压力容器裂纹图像数据进行测试实验，Faster-RCNN、YOLO v3、改进YOLO v3模型测试实验结果如表 3所示。

表 3 测试结果 Table 3 Model test results

由实验测试结果知，改进YOLO v3的mAP在原基础上由0.74提升到0.81，效果提高9%；检测速度由0.26提升到0.11，效果提高42.3%；模型参数数量由61.5 M减少到16.8 M，减少72.6%；FLOPs由154.6GFLOPs减少到35.6GFLOPs，减少76.9%。

4 结束语

1) 从理论上分析了以卷积神经网络为基础的Faster-RCNN和YOLO检测识别算法，分析了其优缺点后，通过分析训练时loss变化曲线和模型测试结果结果，选择了改进YOLO v3网络模型。该算法模型能够提取压力容器裂纹图像更加深层次的特征，并且还能能够防止网络层次增加导致梯度消失问题。

2) 为精简模型和降低模型的参数量以减少其存储空间和计算消耗，提出基于NewEfficientNet-B0的轻量化方法。为提高对微小压力容器裂纹的识别精度，提出改进多尺度预测方法，增加了一个104×104的特征尺度方便对微小压力容器裂纹的检测识别。通过最终的实验的测试结果的对比与分析，可以得到改进YOLO v3在检测识别的准确率和降低算法模型参数数量效果相比其他模型更好。

参考文献

[1]	李生渊. 锅炉检测的常用技术研究[J]. 决策探索(中), 2019(9): 60-61. Li S Y. Research on common technology of boiler inspection[J]. Policy Research & Exploration, 2019(9): 60-61. (in Chinese)
[2]	Oliveira H, Correia P L. CrackIT—An image processing toolbox for crack detection and characterization[C]//2014 IEEE International Conference on Image Processing. Paris, France: IEEE, 2014: 798-802.
[3]	Kapela R, Sniatała P, Turkot A, et al. Asphalt surfaced pavement cracks detection based on histograms of oriented gradients[C]//2015 22nd International Conference Mixed Design of Integrated Circuits & Systems (MIXDES). Torun, Poland: IEEE, 2015: 579-584.
[4]	Ai D H, Jiang G Y, Siew Kei L, et al. Automatic pixel-level pavement crack detection using information of multi-scale neighborhoods[J]. IEEE Access, 2018, 6: 24452-24463. DOI:10.1109/ACCESS.2018.2829347
[5]	Maeda H, Sekimoto Y, Seto T, et al. Road damage detection and classification using deep neural networks with smartphone images[J]. Computer-Aided Civil and Infrastructure Engineering, 2018, 33(12): 1127-1141. DOI:10.1111/mice.12387
[6]	Li P H, Yang Y F, Grosu R, et al. Driver distraction detection using octave-like convolutional neural network[J]. IEEE Transactions on Intelligent Transportation Systems, 6411, PP(99): 1-11.
[7]	Yang F, Zhang L, Yu S J, et al. Feature pyramid and hierarchical boosting network for pavement crack detection[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(4): 1525-1535. DOI:10.1109/TITS.2019.2910595
[8]	Cheng J R, Xiong W, Chen W Y, et al. Pixel-level crack detection using U-net[C]//TENCON 2018 - 2018 IEEE Region 10 Conference. Jeju, Korea (South): IEEE, 2018: 462-466.
[9]	马桂振, 谭云华, 陈太军, 等. 锅炉螺旋水冷壁内裂纹超声检测研究[J]. 锅炉技术, 2021, 52(S1): 49-54. Ma G Z, Tan Y H, Chen T J, et al. Study on ultrasonic detection of inner crack of boiler spiral water wall[J]. Boiler Technology, 2021, 52(S1): 49-54. (in Chinese)
[10]	Jang J, Liu P P, Kim B, et al. Silicon wafer crack detection using nonlinear ultrasonic modulation induced by high repetition rate pulse laser[J]. Optics and Lasers in Engineering, 2020, 129: 106074. DOI:10.1016/j.optlaseng.2020.106074
[11]	Wang R, Wu Q, Yu F M, et al. Nonlinear ultrasonic detection for evaluating fatigue crack in metal plate[J]. Structural Health Monitoring, 2019, 18(3): 869-881. DOI:10.1177/1475921718784451
[12]	邢砾文, 姚文凯, 黄莹. 基于深度学习的含未知复合故障多传感器信号故障诊断[J]. 重庆大学学报, 2020, 43(9): 93-100. Xing L W, Yao W K, Huang Y. Fault diagnosis of multi-sensor signal with unknown composite fault based on deep learning[J]. Journal of Chongqing University, 2020, 43(9): 93-100. (in Chinese)
[13]	杨祖莨, 丁洁, 刘晋峰. 一种新的结合卷积神经网络的隧道内停车检测方法[J]. 重庆大学学报, 2021, 44(6): 49-59. Yang Z L, Ding J, Liu J F. A new tunnel vehicle stopping detection methodology combined with convolutional neural network[J]. Journal of Chongqing University, 2021, 44(6): 49-59. (in Chinese)
[14]	何育欣, 郑伯川, 谭代伦, 等. 基于VGGNet改进网络结构的多尺度大熊猫面部检测[J]. 重庆大学学报, 2020, 43(11): 63-71. He Y X, Zheng B C, Tan D L, et al. Multi-scale giant panda face detection based on the improved VGGNet architecture[J]. Journal of Chongqing University, 2020, 43(11): 63-71. (in Chinese)
[15]	Ren S Q, He K M, Girshick R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.
[16]	Redmon J, Divvala S, Girshick R, et al. You only look once: unified, real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA: IEEE, 2016: 779-788.
[17]	Redmon J, Farhadi A. YOLO9000: better, faster, stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, HI, USA: IEEE, 2017: 6517-6525.
[19]	He K M, Zhang X Y, Ren S Q, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA: IEEE, 2016: 770-778.
[20]	Tan M X, Le Q V. Efficientnet: Rethinking model scaling for convolutional neural networks[C]//International conference on machine learning. Long Beach, United States: PMLR, 2019: 6105-6114.
[21]	Hu J, Shen L, Sun G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA: IEEE, 2018: 7132-7141.