摘要
在长期监测过程中,由于传感器设备故障、供能中断、网络传输问题等诸多因素,导致结构健康监测系统采集的数据存在不完整性。针对这一问题,结合集合经验模态分解(ensemble empirical mode decomposition,EEMD)与双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)在时序处理方面的优势,提出一种基于EEMD-BiLSTM的结构监测缺失数据重构方法。该方法利用EEMD自适应分解监测时序数据为1组代表不同时间尺度的本征模态分量(intrinsic mode function,IMF),使非线性、非平稳序的时序信号平稳化。然后,将IMF分量输入到BiLSTM网络中进行缺失数据重构,提高BiLSTM预测精度。针对6层框架结构缩尺模型和Benchmark有限元仿真模型进行分析,试验结果表明,相比EEMD-LSTM、BiLSTM、LSTM主流方法,提出的EEMD-BiLSTM具有最高预测精度,在5%、10%、15%缺失数据情况下,其
近年来,结构工程领域取得了令人瞩目的成就,其中包括:港珠澳大桥、珠海中心大厦、杭州湾跨海大桥等。然而,随着这些建筑物的规模和复杂性增加,安全性和可靠性面临日益显著的问题。结构健康监测(structural health monitoring,SHM)是一种状态监测、特征识别和状态评估的自动化系统,为结构的管理和养护提供决策支撑,对结构进行实时、准确监测,保证结构的安全性和可靠性。
中国在许多大跨桥梁上安装了结构健康监测系
近年来,许多研究人员对SHM系统不完整的数据集进行建模并重构。一类方法试图从可用数据中重建完整信号。Wan
另一类方法试图采用估计值对数据进行修复,如简单的插值方法(利用空间、时间相关性对缺失数据进行补全)、统计方法(差分自回归移动平均模型)、机器学习等方法。Chen
随着人工智能的崛起,采用深度学习方法进行数据重构受到来自学术界的广泛关注。由于SHM系统采集的传感器数据属于时间序列数据,现有的深度学习方法如卷积神经网络(convolutional neural networks,CNN
尽管深度学习方法具有很好的时序特征抽取与建模能力,并在其他领域具有广泛应用,但现有方法仍存在一定改进空间。从现有的文献发现,基于混合数据重构方法,可以结合深度学习方法的优点,形成适应性更强的网络模型,有效解决缺失数据重构问题。Lei
因此,针对结构监测数据缺失问题,笔者提出一种混合集合经验模态分解(ensemble empirical mode decomposition, EEMD)与BiLSTM深度学习模型,进行缺失数据重构。相比已有的传统方法和单一深度学习模型,提出的混合EEMD-BiLSTM深度学习方法具有显著优势,其中EEMD算法可以显著提高信号的稀疏性,增加重构可行性,同时BiLSTM网络能够学习时序前后依赖特征,实现对缺失数据的准确重构。本研究的创新与贡献如下:
1)在结构健康监测领域,引入混合EEMD与BiLSTM深度学习模型,实现对监测缺失数据的自动重构;
2)设计一种有效的网络结构,使BiLSTM网络输入各IMF分量,采用误差反向传播算法训练模型参数;
3)通过实验分析不同方法(如EEMD-BiLSTM,EEMD-LSTM,BiLSTM,LSTM)的重构效果,提出EEMD-BiLSTM方法具有最佳精度。
研究提出一种基于EEMD-BiLSTM的监测缺失数据重构方法,如

图 1 基于EEMD-BiLSTM的缺失数据重构流程图
Fig. 1 Flowchart of missing data reconstruction based on EEMD-BiLSTM
某一传感器的实时监测结构状态数据作为原始时间序列,通过EEMD方法分解得到个IMF分量和1个残差序列。选取IMF分量作为特征输入,则可表示为
, | (1) |
将数据划分为训练数据、验证数据、测试数据,利用训练数据训练BiLSTM模型参数,通过验证数据进行BiLSTM模型参数的调整,最后将测试数据输入BiLSTM预测模型中进行缺失数据预测。
集合经验模态分解(ensemble empirical mode decomposition,EEMD)是Flandrin
1)向原始序列中添加白噪声序列,得到新序列
, | (2) |
其中,表示第次添加白噪声序列;
2)将通过EMD方法进行分解,得到1个残差序列以及个IMF分量;
3)重复1) 2)步骤N次,并每次向原始序列中加入新的白噪声序列,得到N组IMF分量和残差序列;
4)分别计算经分解得到N组和平均值
, | (3) |
, | (4) |
经上述将N组IMF分量和残差序列求平均值操作,消除原始序列加入均值为零的白噪声。通过EEMD分解原始序列得到的结果与其序列本身相同。
5)最终得到的EEMD分解结果为
, | (5) |
式中:表示IMF分量的个数。
双向长短期记忆(Bi-directional long short-term memory,BiLSTM)网络是对长短期记忆(long short-term memory,LSTM)网
, | (6) |
, | (7) |
, | (8) |
式中:表示权重系数;表示偏置向量,表示LSTM层的激活函数,分别表示前向传播向量、反向传播向量及输出向量。

图 2 BiLSTM网络结构示意图
Fig. 2 Schematic diagram of BiLSTM network structure
为验证提出的EEMD-BiLSTM结构监测缺失数据重构方法的有效性,在6层框架结构缩尺模型数据集上进行测试,并与当前主流的深度学习算法,如EEMD-LSTM、BiLSTM和LSTM进行对比。
如

图 3 6层框架结构缩尺模型示意图
Fig. 3 Schematic diagram of the six-storey shear building
为了确保结构的抗侧力性能及刚度,在预先制作好的混凝土基础上安装底层的基础钢板,用螺栓进行固定连接。然后,将底层钢柱与基础钢板进行螺栓连接,吊装第1层的楼板连接到底层钢柱上,并用高强螺栓将柱和梁连接起来。依次类推,完成6层框架结构缩尺模型的整体吊装。
为获取6层框架结构缩尺模型动力响应,在缩尺模型每个楼层的中心位置布置了6个加速度传感器,所有加速度计都安装在同1个方向,与结构的主轴平行,形成1个L形截面,捕捉振动方向的数据。首先,整个模型被拉出一定的初始位移,然后释放并允许其自由振动,同时用Pulse Labshop和Pulse reflex软件记录每个楼层的加速度时程数据,其中,采样频率为4 167 Hz。

图 4 基于EEMD的加速度时程曲线多尺度特征分析图
Fig. 4 Multi-scale feature analysis of acceleration time-history curve based on EEMD
为获取更多训练样本,采用固定大小的滑动窗口对原始加速度数据进行划分,以采样频率为依据,将窗口大小设定为采样频率的1/20。经滑窗处理后获得约9 500个样本,按6∶2∶2的比例将样本数据集划分为训练集、验证集和测试集。将训练集输入EEMD模型进行信号分解,得到多个IMF分量和残差Res。将分解后的IMF各分量作为输入特征,输入BiLSTM模型进行训练。在模型训练过程中,BiLSTM能够综合考虑当前时间步的输入特征序列以及过去和未来的上下文信息,完成序列数据的建模。为提升模型泛化能力,加入Dropout层随机屏蔽部分神经元,模型训练完成后,利用测试集数据进行模型预测,并与真实结果比较,以评价模型的预测性能。
为进一步评估缺失值预测效果,共选取4个常用的统计评估标准,包括拟合优度(R-squared
(9) |
, | (10) |
, | (11) |
。 | (12) |
实验开发环境主要是采用Keras框架,参数设置的合理性直接影响模型性能,融合EEMD与BiLSTM深度网络模型具体参数设置如
实验参数 | 值 |
---|---|
优化器 | Adam |
学习率 | 0.001 |
损失函数 | MAE |
批尺寸 | 64 |
迭代次数 | 150 |
训练集占比/% | 60 |
验证集占比/% | 20 |
测试集占比/% | 20 |
设定3种时间序列缺失状态,分别是原始加速度时间序列数据随机缺失5%、10%、15%。针对3种数据缺失状态,在训练集和测试集上,对EEMD-BiLSTM方法进行实验分析,并绘制损失函数(Loss)随迭代次数变化情况,结果如

图5 不同缺失比例数据的训练过程
Fig. 5 Training process of different missing data ratio

图 6 不同缺失比率下真实值与预测值对比
Fig. 6 Comparison of true and predicted values for different missing ratios
方法 | 指标 | 缺失比率/% | ||
---|---|---|---|---|
5 | 10 | 15 | ||
EEMD-BiLSTM |
| 0.854 78 | 0.830 91 | 0.812 52 |
MSE | 0.000 12 | 0.000 14 | 0.000 15 | |
RMSE | 0.010 83 | 0.011 68 | 0.012 30 | |
MAE | 0.008 58 | 0.009 28 | 0.009 78 | |
EEMD-LSTM |
| 0.811 05 | 0.809 74 | 0.796 10 |
MSE | 0.000 15 | 0.000 15 | 0.000 16 | |
RMSE | 0.012 35 | 0.012 39 | 0.012 83 | |
MAE | 0.009 83 | 0.009 85 | 0.010 21 | |
BiLSTM |
| 0.840 07 | 0.821 56 | 0.804 57 |
MSE | 0.000 13 | 0.000 14 | 0.000 16 | |
RMSE | 0.011 33 | 0.012 00 | 0.012 56 | |
MAE | 0.009 01 | 0.009 50 | 0.009 95 | |
LSTM |
| 0.835 15 | 0.816 56 | 0.787 07 |
MSE | 0.000 13 | 0.000 15 | 0.000 17 | |
RMSE | 0.011 54 | 0.012 17 | 0.013 11 | |
MAE | 0.009 16 | 0.009 65 | 0.010 45 |
注: 加粗数据表示最好的结果。
具体来看,

图 7 不同缺失数据比例下的预测误差
Fig. 7 Prediction error of different algorithms under missing ratio
综上所述,随着缺失比率持续增加,各方法的预测性能下降还是不可避免的,相比主流的方法EEMD-LSTM、BiLSTM、LSTM,提出的EEMD-BiLSTM结合EEMD分解和BiLSTM的双向学习的优势,使其成为处理时间序列缺失数据的最佳方法。
为进一步验证所提EEMD-BiLSTM算法的有效性,选取了Benchmark有限元仿真模

图 8 Benchmark 有限元仿真模型
Fig. 8 Benchmark finite element simulation model

图9 基于EEMD-BiLSTM的不同缺失数据比率下预测结果分析
Fig. 9 Analysis of prediction results under different missing data ratios based on EEMD-BiLSTM

图10 在不同缺失数据比例下的预测误差
Fig. 10 Prediction error of different algorithms under missing ratio
方法 | 指标 | 缺失比率/% | ||
---|---|---|---|---|
5 | 10 | 15 | ||
EEMD-BiLSTM |
| 0.876 39 | 0.835 02 | 0.817 84 |
MSE | 0.230 59 | 0.310 64 | 0.333 05 | |
RMSE | 0.480 20 | 0.557 35 | 0.577 10 | |
MAE | 0.366 77 | 0.428 91 | 0.445 64 | |
EEMD-LSTM |
| 0.862 45 | 0.821 20 | 0.760 33 |
MSE | 0.256 79 | 0.341 63 | 0.437 76 | |
RMSE | 0.506 74 | 0.584 49 | 0.661 63 | |
MAE | 0.387 10 | 0.450 02 | 0.510 60 | |
BiLSTM |
| 0.807 32 | 0.757 31 | 0.722 65 |
MSE | 0.358 56 | 0.450 38 | 0.524 59 | |
RMSE | 0.598 80 | 0.671 10 | 0.724 29 | |
MAE | 0.470 42 | 0.525 89 | 0.564 02 | |
LSTM |
| 0.811 14 | 0.759 85 | 0.711 85 |
MSE | 0.354 33 | 0.445 50 | 0.528 50 | |
RMSE | 0.595 25 | 0.667 46 | 0.726 98 | |
MAE | 0.464 77 | 0.522 09 | 0.567 22 |
注: 加粗数据表示最好的结果。
EEMD-BiLSTM方法在所有缺失比率下均表现最佳,其R²值最高,MSE、RMSE和MAE值最低。例如,在缺失比率为5%时,该方法的
综上所述,EEMD-BiLSTM在所有缺失比率下均表现最优,在时间序列预测方法的性能方面具有显著优势。
在结构健康监测系统中,针对数据采集过程中存在的数据缺失问题,提出EEMD-BiLSTM数据重构方法,并对6层框架结构缩尺模型和Benchmark有限元仿真模型采集的加速度响应数据进行验证。首先,基于数据增强方法获取训练样本,利用EEMD将加速度时间序列分解为若干IMF分量,从中提取加速度数据的动力模态特征,输入到BiLSTM进行缺失数据重构。从实验结果可以得出以下结论:
1)随着数据缺失比率增加,EEMD-BiLSTM指标衰减较缓慢,这主要由于EEMD分解后,降低了原始数据波动造成的影响,有效提取加速度的数据动力模态特征,BiLSTM利用过去和未来的上下文动力模态信息进行建模,实现序列中的每个时间点准确分析,提高数据缺失预测的精度。
2) BiLSTM具有2个相向传递的LSTM结构,可以更好捕捉时间序列数据中的长期依赖关系,但是非平稳、非线性的数据会影响预测缺失数据结果。在预测缺失数据之前,对数据进行EEMD分解,将平稳的数据带入BiLSTM。EEMD-BiLSTM的组合模型比单一BiLSTM模型的预测精度高。
3) 针对6层框架结构缩尺模型和Benchmark有限元仿真模型,在5%、10%和15%缺失数据比例下,本研究对比EEMD-BiLSTM、EEMD-LSTM、BiLSTM和LSTM方法。结果表明,提出的EEMD-BiLSTM方法具有最高预测精度,在6层框架结构缩尺模型,5%的缺失数据
参考文献
Bao Y Q, Li H. Machine learning paradigm for structural health monitoring[J]. Structural Health Monitoring, 2021, 20(4): 1353-1372. [百度学术]
Chen Z C, Bao Y Q, Li H, et al. A novel distribution regression approach for data loss compensation in structural health monitoring[J]. Structural Health Monitoring, 2018, 17(6): 1473-1490. [百度学术]
Ou J P, Li H. Structural health monitoring in China: review and future trends[J]. Structural Health Monitoring, 2010, 9(3): 219-231. [百度学术]
Wan H P, Ni Y Q. Bayesian multi-task learning methodology for reconstruction of structural health monitoring data[J]. Structural Health Monitoring, 2019, 18(4): 1282-1309. [百度学术]
Li Y T, Bao T F, Chen Z X, et al. A missing sensor measurement data reconstruction framework powered by multi-task Gaussian process regression for dam structural health monitoring systems[J]. Measurement, 2021, 186: 110085. [百度学术]
Chen Z C, Li H, Bao Y Q. Analyzing and modeling inter-sensor relationships for strain monitoring data and missing data imputation: a copula and functional data-analytic approach[J]. Structural Health Monitoring, 2019, 18(4): 1168-1188. [百度学术]
Zhang Z Y, Luo Y Z. Restoring method for missing data of spatial structural stress monitoring based on correlation[J]. Mechanical Systems and Signal Processing, 2017, 91: 266-277. [百度学术]
Rosafalco L, Manzoni A, Mariani S, et al. Fully convolutional networks for structural health monitoring through multivariate time series classification[J]. Advanced Modeling and Simulation in Engineering Sciences, 2020, 7(1): 38. [百度学术]
Hua Y X, Zhao Z F, Li R P, et al. Deep learning with long short-term memory for time series prediction[J].IEEE Communications Magazine, 2019, 57(6): 114-119. [百度学术]
Peng T, Zhang C, Zhou J Z, et al. An integrated framework of bi-directional long-short term memory(BiLSTM) based on sine cosine algorithm for hourly solar radiation forecasting[J]. Energy, 2021, 221: 119887. [百度学术]
Li X, Zhuang W, Zhang H. Short-term power load forecasting based on gate recurrent unit network and cloud computing platform[C]//4th International Conference on Computer Science and Application Engineering. Sanya China: ACM, 2020: 1-6. [百度学术]
Deng Y, Jia H, Li P, et al. A deep learning methodology based on bidirectional gated recurrent unit for wind power prediction[C]//14th IEEE Conference on Industrial Electronics and Applications (ICIEA). Xi’an, China: IEEE, 2019: 591-595. [百度学术]
Fan G, Li J, Hao H. Lost data recovery for structural health monitoring based on convolutional neural networks[J]. Structural Control and Health Monitoring, 2019, 26(10): e2433. [百度学术]
Liu H, Ding Y L, Zhao H W, et al. Deep learning-based recovery method for missing structural temperature data using LSTM network[J]. Structural Monitoring and Maintenance, 2020, 7(2): 109-124. [百度学术]
Oh B K, Glisic B, Kim Y, et al. Convolutional neural network-based data recovery method for structural health monitoring[J]. Structural Health Monitoring, 2020, 19(6): 1821-1838. [百度学术]
Du B W, Wu L Y, Sun L L, et al. Heterogeneous structural responses recovery based on multi-modal deep learning[J]. Structural Health Monitoring, 2023, 22(2): 799-813. [百度学术]
Lei X M, Sun L M, Xia Y. Lost data reconstruction for structural health monitoring using deep convolutional generative adversarial networks[J]. Structural Health Monitoring, 2021, 20(4): 2069-2087. [百度学术]
Li L C, Zhou H J, Liu H L, et al. A hybrid method coupling empirical mode decomposition and a long short-term memory network to predict missing measured signal data of SHM systems[J]. Structural Health Monitoring, 2021, 20(4): 1778-1793. [百度学术]
Flandrin P, Gonçalvès P, Rilling G. EMD equivalent filter banks, from interpretation to applications[M]//Interdisciplinary Mathematical Sciences: 5. Singapore: World Scientific, 2005: 57-74. [百度学术]
Huang N E, Shen Z, Long S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings of the Royal Society of London Series A: Mathematical, Physical and Engineering Sciences, 1998, 454(1971): 903-995. [百度学术]
Yang K, Ding Y L, Geng F F, et al. A multi-sensor mapping Bi-LSTM model of bridge monitoring data based on spatial-temporal attention mechanism[J]. Measurement, 2023, 217: 113053. [百度学术]
Anjneya K, Roy K. Acceleration time history data for experimental shear building model (Kumar Anjneya & Koushik Roy)[EB/OL]. (2021-01-04)[2023-08-23]. https://data.mendeley.com/datasets/snmz587nvb/2. [百度学术]
Saidin S S, Kudus S A, Jamadin A, et al. Vibration-based approach for structural health monitoring of ultra-high-performance concrete bridge[J]. Case Studies in Construction Materials, 2023, 18: e01752. [百度学术]
Kurian B, Liyanapathirana R. Machine learning techniques for structural health monitoring[M]//13th International Conference on Damage Assessment of Structures. Singapore: Springer Singapore, 2020: 3-24. [百度学术]
Nasrollahi A, Deng W, Ma Z Y, et al. Multimodal structural health monitoring based on active and passive sensing[J]. Structural Health Monitoring, 2018, 17(2): 395-409. [百度学术]
Bao Y Q, Beck J L, Li H. Compressive sampling for accelerometer signals in structural health monitoring[J]. Structural Health Monitoring, 2011, 10(3): 235-246. [百度学术]
He Y Y, Zhang L K, Chen Z S, et al. A framework of structural damage detection for civil structures using a combined multi-scale convolutional neural network and echo state network[J]. Engineering with Computers, 2023, 39(3): 1771-1789. [百度学术]