岩土工程场地勘察的目标是通过室内或现场原位试验合理地描述地下土层界面并表征土层内土体物理、力学参数的空间变异性[1-2]。与室内试验[3]相比,原位测试方法,如静力触探试验[4](Cone Penetration Test,CPT)成本更加低廉、测试更加快捷[5-6]。此外,静力触探试验(CPT)能在深度方向获得近乎连续性的锥尖阻力(qc)和侧摩阻力(fs)数据,并以此作为土体的力学响应[7]。因此,CPT广泛应用于表征岩土场地参数、地下土体分层[8-11]、砂土液化评估[12-13]、确定随机场的相关函数和参数等[14-15]。
尽管CPT广泛应用于岩土场地勘察并沿深度方向获得近乎连续的土体力学响应[16],但由于工期、项目投入及技术等条件限制,在特定的工程场地或岩土工程项目中,沿水平方向的CPT钻孔数量通常很少。为解决该问题,学者们提出了众多方法来估计未采样位置处的CPT数据。例如,Fenton[17]提出了采用随机场的方法估计未采样位置的CPT数据,但该方法需要大量的CPT数据标定自相关函数。此外,该方法并未考虑CPT数据在水平方向的空间自相关性。Cai等[18]虽然考虑了水平、深度方向的相关性,并利用条件随机场来估计未采样位置的CPT数据,却依然难以回避平稳随机场假定以及参数估计问题。Juang等[19]提出了利用神经网络估计三维场地未采样位置的CPT数据。虽然该方法在数据拟合及外插上效果显著,近年来在多个领域得以应用,但由于其可解释性差,较难合理量化插值过程中产生的不确定性。量化的不确定性可以有效反映插值结果的可靠性大小。地理统计方法,如克里金法可以有效解决这一问题[20-21],但该方法仅适用于满足平稳性假设的特定土层,很难应用于地下存在多个土层且空间边界不确定的岩土工程场地。Wang等[22]提出了在CPT钻孔数据较少时利用二维贝叶斯压缩感知理论(Bayesian Compressive Sensing,BCS)[23-24]进行岩土分区。然而,由于CPT钻孔深度方向数据较多,该方法计算量大,不能高效估计未采样位置的二维CPT数据。对于具有空间变异性且边界未知的地下土层,如何正确、高效地估计未采样位置的二维非平稳CPT数据,仍然是一个重大课题。
笔者提出一种计算效率较高的无参方法,可以根据数量有限的非平稳CPT钻孔数据估计二维剖面中未采样位置的CPT数据。该方法结合压缩感知(Compressive Sensing,CS)、贝叶斯框架、吉布斯采样[25-26],并引入可快速更新计算结果的克罗内克积,以提高计算效率。与已有文献相比,该方法在估计二维CPT数据方面计算效率显著提高。此外,相比于随机场模型,该方法回避了自相关函数模型选择与参数估计、数据平稳性、高斯分布等假设;相比于神经网络,该方法可以合理确定CPT钻孔数目少带来的不确定性。值得注意的是,该方法要求不同CPT钻孔沿深度方向的力学响应数据一致。
压缩感知(CS)是信号处理领域中新提出的采样方法[27-28]。基于信号本身的可压缩性,CS可以将随着时间或空间变化且自相关的信号从它的小部分数据中重建出来。“可压缩性”意味着信号可表示为少量基函数的加权求和。以一组二维的归一化CPTU数据Qt(见图 1)说明CS的基本概念。Qt =(qt-σv)/σ′v且qt=qc+(1-a)u,其中,σv和σ′v分别为土体的垂直总应力和有效应力,a和u分别为圆锥面积比和孔隙水压力[29]。用F表示上述二维Qt数据,其为Nz×Nx的二维矩阵。数学上F可表示为[27]
式中:N=Nz×Nx;Bt2D是与F同等大小的二维矩阵,表示一系列具有不同特征的二维基函数,其构建与F本身无关;ωt2D是与Bt2D对应的权重系数,表示Bt2D对F贡献的大小。式(1)中,ωt2D大多数元素的值都接近于零,这表明可以使用少量CPT钻孔数据(见图 2)确定ωt2D中极少数重要元素,进而合理估计出二维CPT数据F。令$ \hat \omega _t^{2{\rm{D}}}$表示估算的ωt2D。重建的二维CPT数据$ \mathit{\boldsymbol{\widehat F}}$则表示为
由式(2)可以看出,重建$ \mathit{\boldsymbol{\widehat F}}$的关键是根据有限数量的CPT钻孔数据估算$ \hat \omega _t^{2{\rm{D}}}$。
令矩阵Y表示从场地中nb(nb>1)个CPT钻孔中获得的数据集,并用它来估计$ \hat \omega _t^{2{\rm{D}}}$。Y与ωt2D的关系可以通过Y和F之间的关系推导出来。如图 1、图 2所示,CPT数据Y是F的子集,为大小Nz×nb的矩阵。根据式(1),F是一个与ωt2D有关的函数,故而Y亦是ωt2D的函数。数学上,Y表示为Y =FΨT。其中,ΨT反映了CPT沿水平方向(即图 2(a)中x轴)的勘测位置。上标“T”表示转置运算。
此外,式(1)中F可以分解为矩阵形式F = Bz1DΩ(Bx1D)T[30],Bz1D与Bx1D分别代表为Nz×Nz和Nx×Nx的一维正交矩阵。F = Bz1DΩ(Bx1D)T是式(1)的矩阵形式表达。将F = Bz1DΩ(Bx1D)T代入Y=FΨT,可得
式中:Ax= ΨBx1D。为运算方便,通过依次叠加(YT)的列,将YT向量化为长度为M=(nb× N1) 的列向量y2D
式中:vec(·) 表示向量化;ω2D=vec(ΩT),是式(1)中ωt2D的向量化表示;“⊗”表示克罗内克积;A定义为
有关克罗内克积的更多细节问题可参考文献[31]。根据式(4)可在贝叶斯框架下推导并估计$ \hat \omega _t^{2{\rm{D}}}$。
因为贝叶斯方法可以有效处理各种不确定性,如模型不确定性与空间变异性,因此采用该方法估计$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$。在贝叶斯框架下,$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的估计信息通过其后验概率密度函数(PDF)来反映,即$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}\mid {\mathit{\boldsymbol{y}}^{2{\rm{D}}}}} \right)$[32]。
式中:$ P\left( {{\mathit{\boldsymbol{y}}^{2{\rm{D}}}}\mid {{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}} \right)$为似然函数,反映了给定$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$条件下得到y2D的合理性;$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}} \right)$是不考虑y2D时$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的先验PDF;P(y2D)是归一化常数,保证$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}\mid {\mathit{\boldsymbol{y}}^{2{\rm{D}}}}} \right)$的积分为常数1。
显然,构建式(6)中$ P\left( {{\mathit{\boldsymbol{y}}^{2{\rm{D}}}}\mid {{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}} \right)$和$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}} \right)$是进行贝叶斯估计的核心,分别构建为高斯似然函数和多层先验分布。为了推导$ P\left( {{\mathit{\boldsymbol{y}}^{2{\rm{D}}}}\mid {{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}} \right)$,以均值为零且方差未知的高斯随机变量ε表示y2D与Aω2D之间的残差。另外,为方便推导,将ε的方差的倒数表示为τ。假定残差之间相互独立,$ P\left( {{\mathit{\boldsymbol{y}}^{2{\rm{D}}}}\mid {{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}} \right)$可表示为
式中:τ未知,可将其作为随机变量并与$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$同步更新。因此,需构建P($ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, τ)=P($ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$)P(τ)。根据Zhao等[33]、Zhao等[34]的研究,$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的先验信息模型构建如下:首先,令$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的每个元素均服从均值为零、方差为αt-1的高斯分布,则$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}\mid \mathit{\boldsymbol{\alpha }}} \right)$可表示为$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}\mid \mathit{\boldsymbol{\alpha }}} \right) = \prod\limits_{t = 1}^N {\alpha _t^{1/2}} (2{\rm{ \mathsf{ π} }} ) - 1/2\exp \left[ { - {\alpha _t}{{\left( {\mathit{\boldsymbol{\widehat \omega }}_t^{2{\rm{D}}}} \right)}^2}/2} \right]$,其中,α是表示αt的矢量形式;其次,假定αt服从参数为1和γ/2 (γ>0) 的逆伽玛分布,即P(αt|γ) = γ/2αt-2exp[-γ/2·αt-1] (t = 1, 2…N)且$ P(\mathit{\boldsymbol{\alpha }}\mid \gamma ) = \prod\limits_{t = 1}^N P \left( {{\alpha _t}\mid \gamma } \right)$;最后,假定γ服从伽马分布,即P(γ)=(b0)a0γa0-1exp(-b0γ)/Γ(a0),其中a0和b0为极小非负数(如a0 = b0 = 10-4),这对构建$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的无信息先验分布至关重要。此外,假定τ亦服从伽玛分布,且P(τ)=d0c0τc0-1exp(-d0τ)/Γ(c0),c0和d0分别取值为1和10-4,可以使得P(τ)成为τ的无信息先验分布。
将$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}\mid \mathit{\boldsymbol{\alpha }}} \right)$、P(α|γ)和P(τ)代入P($ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, γ, τ),可得到联合先验PDF
由于将α和γ均视为随机变量,因此在式(8)中使用了$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}{\rm{, }}\mathit{\boldsymbol{\alpha }}{\rm{, }}\gamma {\rm{, }}\tau } \right)$, 而非$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}{\rm{, }}\tau } \right)$。基于式(6)中的贝叶斯定理、式(7)中的似然函数以及式(8)中的先验PDF,后验PDF可表示为$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}, \mathit{\boldsymbol{\alpha }}, \gamma , \tau |} \right.\mathit{\boldsymbol{y}}) = P\left( {{\mathit{\boldsymbol{y}}^{2{\rm{D}}}}\mid {{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}, \tau } \right) \times P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}, \mathit{\boldsymbol{\alpha }}, \gamma , \tau } \right)/P\left( {{\mathit{\boldsymbol{y}}^{2{\rm{D}}}}} \right)$。由于P(y2D)无解析表达式,故P($ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, γ, τ|y)亦无解析解。然而,笔者发现,在给定其他3个参数的条件下,($ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, γ, τ) 中剩余参数的后验概率密度函数均有解析解。例如,以α、γ、τ为条件的$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的后验PDF服从多元高斯分布,均值和协方差矩阵为
式中:Dα是N×N的对角矩阵,且对角线上元素为Dα(t, t)=αt。其他几个分布P(α|$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, τ, γ, y2D)、P(τ|$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, γ, y2D)和P(γ|$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, τ, y2D)分别服从广义逆高斯分布和两个伽玛分布。更多细节可以参考文献[32],此处只将结果展示如下,其中P(α|$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, τ, γ, y2D)推导为
式中:at=$ \mathit{\boldsymbol{\hat \omega }}_{t}^{2{\rm{D}}}$;bt=γ;p=-1/2;Kp(·)表示参数为p的第二类修正Bessel函数。P(τ|$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, γ, y2)和P(γ|$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, τ, y2D)可分别为
式中:cn=M/2+c0;dn=d0+1/2(y2D)T(y2D)-($ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$)TAT y2D+1/2($ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$)TATA$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$;γa=N+a0和γb=b0+$ \sum\limits_{t = 1}^N {\alpha _t^{ - 1}} $。由于($ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, γ, τ)这些变量相互依存,难以得出$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的解析解。鉴于上述条件,概率密度函数的解析性即式(9)~式(11),笔者采用MCMC模拟中的吉布斯采样算法最终估计获得$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的统计特征。
尽管$ P\left( {{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}\mid \mathit{\boldsymbol{y}}} \right)$无解析解,但可采用吉布斯采样方法生成大量$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$后验样本对其进行表征。吉布斯采样过程为:1)提供α、τ、和γ的初始值,将初始值代入式(9),计算$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$的均值和协方差矩阵并由此生成一组$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$样本。2)将随机产生的样本与已知的τ、γ值同时代入式(10),产生一组α样本。3)将随机产生的$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$、α样本以及已知的γ,代入式(11a),τ为P(τ|$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, γ, y2D)中的唯一变量。4)在式(11b)中代入α、τ和$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$,即γ为P(γ|$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$, α, τ, y2D)中的唯一变量。5)收集α、τ和γ的样本,并在步骤1)中替换α、τ和γ的值,然后重复该过程,直到获得指定数量的MCMC样本。值得注意的是,吉布斯采样是马尔科夫链蒙特卡洛(Markov Chain Monte Carlo, MCMC)的一种特殊形式,与传统的MCMC方法不同,吉布斯采样可以有效处理高维参数问题。这是由于吉布斯采样需要已知待处理参数的条件概率分布,如式(9)~式(11)。相比之下,传统MCMC方法中的算法,如Metroplis-Hasting更加泛化,在未知参数维度较高的时候,由于难以找到合适的高维提议分布(proposal probability density function),进而导致生成样本的接受率过低,计算效率因此受到极大影响。
由于$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$服从多元高斯分布,可在步骤1)中用Cholesky分解方法随机产生$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$样本,表示为
式中:$ {\bf{CO}}{{\bf{V}}_{{{\widehat {\bf{ \pmb{\mathsf{ ω}} }}}^{2{\rm{D}}}}}} = \left( {{\mathit{\boldsymbol{L}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}} \right){\left( {{\mathit{\boldsymbol{L}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}} \right)^{\rm{T}}}{\mathit{\boldsymbol{L}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$是下三角矩阵;z是长度为N=N1×N2的列向量,其中每个元素都是均值为零、方差为1的标准高斯随机变量。式(12)表明,可通过独立分布的z来随机生成$ {\mathit{\boldsymbol{\widehat \omega }}^{2{\rm{D}}}}$样本。然而,由于$ {\mathit{\boldsymbol{\widehat \omega }}^{2{\rm{D}}}}$的协方差矩阵$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$过于庞大,基于式(12)的分解无法在普通个人电脑上执行。此外,吉布斯采样流程涉及$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$的反复更新与分解,这就使得直接通过式(12)生成$ {\mathit{\boldsymbol{\widehat \omega }}^{2{\rm{D}}}}$的样本极其困难,进而导致难以高效随机生成非平稳的二维CPT数据。
由式(9)可知,$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$是关于式(5)中已定义的A的函数。根据式(5),计算$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$的因子ATA可推导为
式中:Bz为单位正交矩阵。因此,Iz= BzTBz为单位矩阵。将式(13)代入$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$中,得到$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$=[(Iz⊗(τAxTAx))+ Dα]-1。根据克罗内克积的定义,Iz⊗(τAxTAx)可表示为
式中“0”是一个Nx×Nx的零元素矩阵。将式(14)代入$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$,得
式中:D1α、D2α… DN1α均为大小N2×N2的对角矩阵,分别表示Dα中N2个连续且互斥的对角线元素。由式(15)可知,$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$为分块对角矩阵,可按式(16)计算。
式中:$ {\bf{COV}}_{{{\mathit{\boldsymbol{\widehat \omega }}}^{{\rm{2D}}}}}^i = {\left[ {\left( {\tau \mathit{\boldsymbol{A}}_x^{\rm{T}}{\mathit{\boldsymbol{A}}_x}} \right) + \mathit{\boldsymbol{D}}_i^\alpha } \right]^{ - 1}}$。式(16)将(N1×N2) × (N1×N2) 的巨型矩阵的逆矩阵运算简化为一系列尺寸为N2×N2小矩阵的逆矩阵的运算。此外,式(16)中无Bz项,这进一步提高了$ {\bf{CO}}{{\bf{V}}_{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}}$的分解效率。
利用AT=(Bz1D⊗Ax)T=(Bz1D)T⊗(Ax)T与式(16)可得到$ {\mathit{\boldsymbol{\mu }}_{\mathit{\boldsymbol{\hat \omega }}\mathit{D}_{}^{2{\rm{D}}}}}$
式中:$ \mathit{\boldsymbol{\mu }}_{\mathit{\boldsymbol{\hat \omega }}^{2{\rm{D}}}}^i = \tau \sum\limits_{j = 1}^{{N_1}} {{b_{j, i}}} {\bf{COV}}_{\mathit{\boldsymbol{\hat \omega }}^{2{\rm{D}}}}^{i }\mathit{\boldsymbol{A}}_x^{\rm{T}}\mathit{\boldsymbol{y}}_j^{2{\rm{D}}}$,为$ {\mathit{\boldsymbol{\mu }}_{\mathit{\hat \omega }_{}^{2{\rm{D}}}}}$的第i项第Nx个连续元素;yj2D为y的第j项第nb个连续元素;bj, i为位于矩阵B1第j行与第i列的元素。将式(16)、式(17)代入式(12), 得
式中:$ \mathit{\boldsymbol{\widehat \omega }}_i^{2{\rm{D}}} = \mathit{\boldsymbol{\mu }}_{{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}}^i + \mathit{\boldsymbol{L}}_{{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}}^i{\mathit{\boldsymbol{z}}_i}$,表示$ {\mathit{\boldsymbol{\widehat \omega }}^{2{\rm{D}}}}$的第N2个连续元素;$ \mathit{\boldsymbol{L}}_{{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}}^i$是对应于$ {\bf{COV}}_{{{\mathit{\boldsymbol{\widehat \omega }}}^{{\rm{2D}}}}}^i$的下三角矩阵,且$ {\bf{COV}}_{{{\mathit{\boldsymbol{\widehat \omega }}}^{{\rm{2D}}}}}^i = \left( {\mathit{\boldsymbol{L}}_{{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}}^i} \right){\left( {\mathit{\boldsymbol{L}}_{{{\mathit{\boldsymbol{\widehat \omega }}}^{2{\rm{D}}}}}^i} \right)^{\rm{T}}}$;zi是长度为N2的列向量,表示Nx个独立的、标准的高斯随机变量。式(18)表明$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$随机样本的产生转变为N1组标准独立高斯随机变量zi的随机实现。相比式(12),式(18)中进行$ {\mathit{\boldsymbol{\widehat \omega }}^{2{\rm{D}}}}$的随机生成时仅涉及一系列大小为(Nx×Nx)的矩阵运算,避免了(Nz×Nx)×(Nz×Nx) 巨型矩阵的求逆与分解。Xiao等[35]、Ching等[36]、Yang等[37]也用到了类似方法。因此,该方法极大提高了$ _{\mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}}$样本生成的计算效率。
将生成的$ {\mathit{\boldsymbol{\widehat \omega }}^{2{\rm{D}}}}$随机样本代入式(2),生成大量非稳态二维CPT数据。值得注意的是,该方法不需要对F的平稳性进行假设,因此,可直接用于估计具有空间变异性和多个未知边界的土层的二维非稳态CPT数据。虽然上述公式推导看似复杂,但通过商业软件,如MATLAB[38]可以轻易地将数学表达式编译为用户函数。为了进一步说明该方法的逻辑过程,这里给出了文中方法的流程图,主要包含5个步骤。步骤1~3属于方法的准备阶段,步骤4属于方法的核心,步骤5属于方法的结尾,详见图 3。此外,为了便于读者重复该工作,给出了步骤4,即方法核心的伪代码,详见图 4。
为了验证该方法,选取一组分布在3层土层内的二维CPT锥尖阻力(Qt)数据,如图 1所示。此例中,采用高斯平稳随机场生成器(如循环嵌入算法)在垂直方向和水平方向分别以ηz=0.02 m和ηx=0.5 m的分辨率生成每层内的Qt数据[39]。随机场模拟中涉及的参数包括Qt的均值、标准差SD、垂直方向以及水平方向相关长度λz和λx。第1~3层的均值分别取为12、40和12;SD分别为2、5和2;相关长度分别为λz=2 m和λx=20 m,与文献[40]一致。在生成每层Qt数据时采用单指数自相关函数
式中:Δz=zi-zm和Δx=xj-xn分别表示位置(zi, xj)和(zm, xn)沿z和x方向的相对距离。利用上述随机场参数和随空间变化的岩土层边界,可获得3层内的非稳态二维Qt数据,如图 1所示。尽管每层中的Qt数据是稳态的,但由于不同土层中Qt的统计量不同,图 1所示的二维数据集是非稳态的。
如图 2所示,当nb=5时的CPT钻孔锥尖阻力数据可作为所提出方法的输入Y (步骤1)。首先,令y =vec(YT) (步骤2)。之后,记录Qt沿x方向的位置,以此构造矩阵Ψ;确定Nz和Nx,Nz代表Qt数据点沿深度方向的数量,本例中Nz=500。Nx表示分辨率为ηx的插值后的CPT数据沿x2方向的数量,计算公式为Nx=hx/ηx+1,式中hx代表场地的长度。例如,令hx=127.5 m、ηx=0.5 m,则Nx=256。在MATLAB[37]中输入使用“dctmtx”以及Nz、Nx构造一维正交矩阵Bz1D与Bx1D,且Ax= ΨBx1D(步骤3)。
接下来按照图 4引入克罗内克积的吉布斯采样方法,生成大量$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$样本(步骤4)。此例中,首先随机产生了2 100个$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$样本。然后每隔20步收集一次$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$样本,从而保证在丢弃前100个不可信的$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$样本后,样本之间的统计相关性较弱。如此,共生成ns = 100个相互独立的随机样本。将每次产生的$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$样本代入式(2),产生一个二维的Qt样本。100组$ \mathit{\boldsymbol{\hat \omega }}_{}^{2{\rm{D}}}$样本产生了ns = 100组二维且独立的Qt样本(步骤5)。图 5给出了上述两个CPT样本。值得注意的是,虽然这里只生成了100个相互独立的Qt样本,但其统计特征基本收敛,如每一点的均值及标准差并不随着MCMC样本的增多而发生变化。
为了说明引入克罗内克积对计算效率的提升,记录生成上述100个独立CPT样本的时间,见表 1。由表 1可见,使用64位Windows 10操作系统的Intel © Core®i7-9700 3.0 GHz CPU和16.0 GB RAM的计算机,生成100组独立二维CPT样本大约需40.6 s。然而,若不采用序列更新方法,即直接采用式(12)生成样本时,同一台计算机上大约需1 421.2 s。相比于原始方法,该算法在计算效率上提高了约35倍。随着CPT勘测钻孔数量nb的增加,使用序列更新技术的计算效率提高会更为明显。
利用上述100个二维Qt样本可得其均值,如图 6所示。结果表明,即使在未知地下边界处,Qt均值的分布也与图 1所示较为一致。表明利用该方法生成的二维非稳态Qt样本在统计上保留了图 1中Qt原始数据的非稳态模式。此外,根据生成的二维Qt样本还可计算每一点的标准差,见图 7。结果表明,CPT钻孔位置处的标准差非常小,说明在这些位置估计的Qt可靠性和可信度较高。因为这些位置的Qt数据已知,并将其作为建议方法的输入。相反,因为远离测量点的位置有效信息极少,导致远离CPT钻孔位置的样本标准差相对较大。
为了进一步验证该方法插值的合理性,比较图 2(a)中4个未测量钻孔(即BH1、BH2、BH3、BH4)的Qt数据。图 8(a)~(c)分别以虚线绘制了该方法在这4个钻孔位置插值的Qt数据。为进行比较,图 8以粗线给出了BH1至BH4处的原始Qt变化曲线。图 8显示,每个子图中虚线的变化趋势与实线一致,表明利用提出的方法生成的Qt样本是合理、可靠的,并较为合理地刻画了图 1中CPT数据的非平稳特点。
值得注意的是,图 8中虚线、灰线和粗实线之间存在一些差异。这是因为使用提出的方法时,输入的CPT钻孔数量较少。当nb增加时,二维Qt样本会更加接近CPT真实数据。
采用nb=5、15、25和50的案例探讨该方法的性能。对于每个nb案例,前述方法随机生成100个独立的二维Qt样本,然后利用这100个Qt样本计算每个位置的Qt均值及标准差,详见图 9、图 10。由图 9可以看出,随着nb的增加,每个位置的Qt样本均值越来越接近于图 1。当nb=25时,Qt样本均值与实测Qt几乎相同。此外,图 10显示,随着nb的增加,每个位置估算的Qt标准差不断减小,表明每个位置Qt估算值的可靠性和置信度都有所提高。该计算结果反映了本文所提方法的数据驱动本质。
另外,随着nb的增加,采用序列更新技术的计算时间会略有延长,如表 1所示。但与不采用序列更新技术的方法相比,该方法所增加的计算时间几乎可以忽略。当nb=15时,该方法仅需约79.6 s,而未采用序列更新技术的方法需9 h以上(见表 1)。两种方法计算时间的差距表明,所提出的方法可显著提高计算效率。
值得强调的是,该方法可以较为合理地考虑CPT钻孔数量导致的不确定性,为了定量说明不确定性的大小,根据图 9、图 10分别计算出了nb=5、15、25、50不同情况下变异系数(δ=σ/μ×100%)的中位数,分别是11.80%、10.86%、9.36%与8.10%。此外,根据计算经验,该方法能适用的最少CPT钻孔数在4~5个左右,如果CPT钻孔更少,应谨慎使用该方法。
为进一步验证方法的有效性,选取位于日本冈山河堤的某工程场地进行验证研究。该场地自上而下主要由砂土、黏土或粉土、砂土组成。其中上层砂土厚约2 m,黏土最厚约3 m,粉土厚约1~2 m,粉土下面仍主要以砂土为主。为了探明该河堤的软土空间分布,日本工程师在此进行了一系列的CPT。选取其中的CPT-201~CPT-207来验证该方法。图 11给出了上述7个CPT钻孔的位置分布图,其中,CPT-204用来验证,其余CPT标准化Qt数据当作输入。所有的数据均来自TC304免费数据库(http://140.112.12.21/issmge/tc304.htm)。按照该方法,可以得到Qt的二维剖面分布,其均值与标准差见图 12。由图 12可知,估计的Qt数据离CPT钻孔位置愈接近,对应的标准差愈小,反之,则愈大。由于这是真实原位试验数据,无法得知CPT-204以外的真实数据。这里以CPT-204对应的Qt数据与此位置的估计数据进行对比,见图 13。图 13显示,虽然估计值与试验值之间存在一定差距,但两者趋势基本一致;此外,CPT-204的大部分实测试验值落在估计值的95%置信区间里,间接说明该方法的准确性以及鲁棒性。
基于吉布斯采样与贝叶斯压缩感知方法,提出了一种快速估计未采样位置的非平稳静力触探测试数据(CPT)的方法。该方法属于无参估计范畴,能够自动考虑静力触探数据沿水平方向的相关性,同时回避了水平、深度方向自相关函数的采用以及数据平稳性等假设。生成的CPT数据可用于解决各种岩土工程和地质工程问题,如土壤分层和分区、土壤液化潜力评估及其空间变异性表征、岩土设计参数的间接估计等。该方法为解决实际工程问题提供了一种概率工具,尤其是针对在实践中经常遇到的沿水平方向的CPT勘测钻孔数量较少的情况。最后,通过数值与实际工程案例对提出的方法进行验证,结果表明,该方法较为准确,并且采用序列更新技术后可显著提高计算效率,具有较强的鲁棒性。