网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

微观轨迹信息驱动的Bi-LSTM合流区车速预测  PDF

  • 秦雅琴
  • 夏玉兰
  • 钱正富
  • 谢济铭
昆明理工大学 交通工程学院,昆明 650224

中图分类号: U491.2

最近更新:2023-05-05

DOI:10.11835/j.issn.1000-582X.2022.205

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

为明确城市快速路合流区的微观速度特性,确保车辆在衔接段运行速度协调可控,使车辆安全运行。首先,基于无人机高空视频,从广域视角提取了典型多车道交织区全样本高精度车辆轨迹数据,分析车速的累积频率、分布趋势、特征百分位值等运行特性。然后,基于可有效捕捉前向历史速度数据的变化特征的LSTM模型,构建Bi-LSTM车速预测模型;考虑到人工设置训练参数对模型预测性能的影响较大、时间较长,提出基于遗传算法优化的Bi-LSTM速度预测模型(GA-Bi-LSTM)。最后,以R2、Error Mean、Error StD、MSE、RMSE、NRMSE、秩相关rs这7类评价指标,建立多指标融合的评价方案。结果表明:GA-Bi-LSTM速度预测模型表现较优,拟合指标R2、秩相关rs分别为0.904 6、0.949 5,误差指标Error Mean、Error StD、MSE、RMSE、NRMSE分别为0.004 1、0.447 0、0.199 7、0.446 9、0.076 5。研究成果可为城市快速路的合流区车速调控提供理论依据。

城市快速路合流区因主线与匝道车流的交汇,易产生交通瓶颈,降低通行效率,影响行车安

1。车速作为衡量交通状态的一个重要指标,逐渐成为当前交通预测的重点研究对象之一。由于车速存在随机性、非线性、时空相关性等问题,如何准确地挖掘其在时间和空间上的特点,成为车速预测的关键。

国内外研究人员在数据驱动的交通预测方面开展了有益探索,主要围绕参数模型和深度学习展

2。参数模型预测方法主要有多元线性回3、自回归移动平4(integrated moving average,ARIMA)、卡尔曼滤5(kalman filter, KF)等。由于交通参数特征具有数据规模大、维度复杂并且提取难度高的特点,参数模型稳定性较弱,难以反映其非线性变化特征。随着计算机处理能力的提升,深度学习因其深层次的数据表达能力成为交通预测的重要手段,得出了较多具有参考价值的研究成6⁃7。由于单一模型都有自身特点和应用局限性,反映数据信息也存在一定的差异,因此使用单一模型进行预测难免导致数据信息丢失。基于此,将不同模型通过适当方式进行有机融合,形成组合预测方法,提升预测准确性和稳定性,逐渐成为研究发展的需8⁃10

然而集成模型通常需要大量的参数调节实验来提升模型的结构性

11,当面对已知样本和计算单元受到限制的情况下,其对复杂问题的泛化能力及计算能力同样难以满足要求,无法学习更有用的特征。此外,车路协同条件下高精度、高频率的交通信息采集要求,对交通参数的有效预测造成了一定限制。

针对以上问题,为进一步提高速度预测的准确性,笔者构建一种基于遗传算法(genetic algorithm, GA)优化的双向长短期记忆(bi-long short term memory, Bi-LSTM)网络合流区车速预测集成模型(GA-Bi-LSTM)。基于无人机视频提取技术及核相关滤波(kernel correlation filter, KCF)算法获取合流区高精度车辆轨迹数据,利用Bi-LSTM提取合流区车辆速度的非线性、不稳定性时空变化特征,构建Bi-LSTM车速预测模型,考虑到Bi-LSTM的训练时间较长,人工设置训练参数对预测性能的影响,为达到全局最优,采用遗传算法对Bi-LSTM模型进行超参数寻优,实验结果表明,笔者提出的GA-Bi-LSTM车速预测集成模型优于基准Bi-LSTM模型,并具有较好的稳定性和鲁棒性。

1 车速预测模型的构建

1.1 Bi-LSTM车速预测模型

长短期记忆网络(long short term memory, LSTM)作为循环神经网络(recurrent neural net, RNN)网络的改

12,由遗忘门ft、输入门it、输出门Ot组成。Bi-LSTM模型是在LSTM的基础上,将单向的LSTM层变为双向的Backward层和Forward层,既继承了LSTM能够避免梯度消失及梯度爆炸的优势,又解决了LSTM在信息处理上只按照单向先后顺序的问题,能够实现对数据特征和规律更加全面的分析,其算法框架如图1所示。

图1  Bi-LSTM框架

Fig. 1  The framework of the Bi-LSTM model

Bi-LSTM在t时刻输出前向和后向的组合速度特征可表示为

yt=ωy·[ht(r),ht(b)]+by, (1)

式中:ht(r)ht(b)分别为t时刻Backward层和Forward层中隐藏层的输出;ωyby分别为权重和偏置。

利用Bi-LSTM模型进行速度预测的具体步骤为:

1)输入速度序列X=[x1,x2,x3,,xn],划分出80%的训练集与20%的测试集,由于文中的数据基本服从正态分布,且存在异常值,为保证预测结果的准确性,考虑先对数据进行min-max标准化处理,为

xi'=xi-xminxmax-xmin (2)

式中:xi为第i个原始数据;xi'为标准化处理后的新数据。

2)初始化隐藏层状态ho、神经单元的的细胞状态co、最大训练次数等超参数。将经过步骤1)处理后的数据输入第一层Bi-LSTM神经单元。

3)对当前时刻遗忘门向量ft、输入门向量xt、记忆细胞向量ct、输出门向量Ot、隐藏状态ht分别进行计算,保留ctht并将其传输到下一时刻的Bi-LSTM神经单元。

4)判断Backward层和Forward层的LSTM神经单元是否学习结束,若没有结束,则继续步骤3)。

5)重复以上步骤计算下一层的Bi-LSTM神经单元,随后采用Dropout函数随机丢失一部分特征,以防止出现过拟合现象,最后,通过全连接层进行加权整合输出如式(1),获得合流区车速预测值。

1.2 遗传算法优化的Bi-LSTM速度预测模型

执行车速预测任务时,需确定Bi-LSTM的超参数以保证算法获得最优性

12,影响模型性能主要参数为:隐藏层单元数(hidden layer units,Hu)、学习率(learning rate,Lr)、隐藏层数(hidden layers,Hl)、L2正则化因子(L2 regularization,L2)、Bi-LSTM层数(Bi-LSTM layers,Ls)。

考虑到Bi-LSTM模型的训练时间较长,人工设置上述参数对预测性能的影响较大,为保证模型预测性能,文中构建优化算法对参数进行自动寻优。遗传算法(GA)是模拟生物进化进行个体选择、交叉和变异的一种算

13,其核心为参数编码、初始群的设定和适应函数的确定,具有可拓展性强、易于其他算法进行结合使用的优点。因此,文中将遗传算法与双向长短期记忆网络相结合,构建遗传算法优化的Bi-LSTM速度预测模型(GA-Bi-LSTM)。通过对LSTM模型参数动态调优,获取搜索空间内的最优解,具体步骤为:

1)参数设定。将超参数[Hu,Lr,H1,L2,Ls]调节过程转换为染色体基因表达问题,选取预测结果的均方误差(MSE)作为适应度函数F,用以反映Bi-LSTM的模型优劣,F的计算公式为

F=1Ni=1Nxi-act-xi-out, (3)

式中:N为样本数量;xi-act为期望输出;xi-out为实际输出。

2)编码解码。根据Bi-LSTM涉及的超参数特点,采用实数编码方式,提高编码方式与求解问题形式之间匹配度以及算法的局部搜索能力。

3)初始种群。根据Bi-LSTM模型结构特性,选择轮盘赌策略进行染色体优选,即模型超参数[Hu,Lr,H1,L2,Ls]优选,设群体大小为n,个体i的适应度为Fi,则个体i被选中遗传到下一代群体的概率为

Pi=1Fi/i=1n1Fi, (4)

4)交叉变异。基于序值和拥挤距离选择序值小、拥挤距离大的个体,接着对交配池中个体进行交叉与变异操作。

5)结果判断。若满足种群迭代次数条件,则停止计算,输出最优参数组合[H¯u,L¯r,H¯1,L¯2,L¯s],否则,继续交叉变异,直至找到Bi-LSTM最佳参数组合结果。

6)基于上述优化步骤,完成GA-Bi-LSTM速度预测模型的构建。

2 数据获取与分析

2.1 高空视频采集

文中选取某多车道交织区为研究对象,该交织区承担东-西流向主要过境流量,具有速度离散、行为随机、冲突集聚等独特的交通特性,导致车速变化规律难以准确掌握。在天气良好的工作日,利用无人机悬停于交织区上方120 m采集车辆运行高清视频,如图2所示。在实验过程中,为避免数据采集影响交通运行,要求实验人员在人行道或周边高地,使用无人机装置录制工作日高、平峰高清视频数据。

图2  高空视频拍摄场景

Fig. 2  High-altitude video shooting scene

2.2 交通信息提取

为从航拍视角获取有效的车辆运行宏微观信息,采用多尺度KCF车辆跟踪优化算法对视频中的运动车辆进行识别和跟踪,并对数据进行了坐标变换、数据验证和误差消除等处理分析,提取流程如图3所示,得到帧ID、时间ID、车辆ID、车辆质心坐标等车辆动态属性。基于此,构建交通流信息与车辆行为信息基础数据库,包括车速、加速度、速度角度等。

图3  数据提取过

14

Fig. 3  Data extraction process

通过车辆自动跟踪及人工标定,获取行经交织区的1 000辆车的完整轨迹,得到共计30余万条微观轨迹数据,轨迹信息时间精度0.1 s、空间精度0.1 m/px,数据颗粒度小,检测结果精度较高。

2.3 合流区速度分析

2.3.1 合流区车速分布

高峰与平峰时段的合流区车速频率分布及数据拟合如图4所示,可以看出:

图4  ()峰状态下的合流区速度分布

Fig. 4  Speed distribution in the merging zone under normal (rush hours) state

1)高峰时段速度总体处于[0,20] km/h杂乱波动,主要集中于6±3 km/h区间,平均速度约5.86 km/h。其中,85%车速小于10.0 km/h,速度累积频率曲线的斜率突变点出现在90%分位左右。这是因为在高峰状态下,合流区车辆数量较多且前后跟驰密集,来自主线与匝道的车辆在保证安全的情况下在此进行汇合,车辆低速缓慢行驶,导致通过合流区的车速上下波动。

2)平峰时段车速分布略显扁平,有序分布于[7.5,45] km/h内,主要集中于20±10 km/h,平均速度约23.3 km/h,85%车速小于32.4 km/h,速度累积频率曲线平稳上升,斜率突变点出现在85%分位左右,说明平峰时段车辆从匝道和主线驶入合流区时,基本不受路径选择、平纵线型、交织构型等外在因素影响,行车间距与视距充足,车辆之间产生的影响较小,车辆选择近似匀加速行驶。

2.3.2 合流区车速描述统计

为进一步验证合流区车速描述统计规律,如表1所示。假设检验方面,Kline

15提出,当样本数据偏度的绝对值小于3,峰度的绝对值小于10时,可认为观测变量基本服从Gaussian分布。因此,可认为合流区车速运行数据符合Gaussian分布;车速统计方面,高峰时段合流区速度的均值、标准差、50分位值、85分位值均小于平峰状态,车速大幅衰减,均达50%以上。

表1  合流区速度描述统计
Table 1  Speed descriptive statistics in the merging area
合流区速度统计观测数均值标准差50分位值85分位值偏度(<3)峰度(<10)
平峰时段/(km∙h-1) 20 445 23.298 9.381 22.235 32.394 0.342(Y) 0.128(Y)
高峰时段/(km∙h-1) 150 860 5.863 3.790 6.612 9.918 0.944(Y) 2.535(Y)
((Vm-Vm)/Vm)/% 74.83 59.6 70.26 69.38

由前述分析可知,实例合流区高峰时段具有车速离散、分布紊乱、瓶颈现象等独特的特性,车速变化规律难以准确把握。面向车路协同系统的速度控制调节,须保证此类非典型场景复杂车速运行精准预测。

3 模型验证

3.1 模型训练

为体现Bi-LSTM模型的性能优势,人工设置Bi-LSTM模型结构性能使其达到最优。按隐层数量×遍历轮数×批大小的形式,设计了表2所示的24组交叉实验进行测

14。模型包含4类隐藏层结构,第1类只有1个隐藏层,隐藏层单元数为100,表示为h100;第2类有2个隐藏层,神经元数量均为100,表示为h100×h100,以此类推其余两类分别为h100×h100×h75h100×h100×h75×h75

表2  交叉实验结构
Table 2  The structure of the cross-experiment
隐藏层数遍历轮数批大小模型组别
h100 100~200,步长为100

32~128,

步长为32

1~6
h100×h100 7~12
h100×h100×h75 13~18
h100×h100×h75×h75 19~24

完成24组训练测试后,根据模型的损失均值L¯0.05和RMSE均值MRMSE筛选出误差最小的结构参数组合,作为模型的最优结构参数。最终采用第4组(隐藏层为h100,批大小为32,遍历轮数为200)作为Bi-LSTM模型的最优结构参数。为保证模型控制条件唯一,将Bi-LSTM车速预测模型的最优结构参数值代入GA-Bi-LSTM车速预测模型中,使两模型具有相同的初始结构参数,此时针对GA-Bi-LSTM车速预测模型进行自动调参,如表3所示,进行合流区高峰时段速度预测。

表3  超参数设置范围
Table 3  Setting range for hyperparameters
优化指标隐藏层数Hl隐藏层单元数HuBi-LSTM层Ls基础学习率LrL2正则化因子L2
域空间 1,4 [50,200] 1⁃2 [1×10-3,1] [1×10-10,1×10-2
初始值 1 100 1 0.005 0 1×10-10

3.2 预测效果评价

针对高峰时段合流区车速数据,考虑到0.1 s时间窗口预测尺度适用性相对不

4,文中将速度值按照从小到大排序构建历史时域数据集xi,基于该结果采用滑动时窗的方法提取1 s的速度序列平均值,如图5所示。时间步长设置为1 s,每次向前更新10个数据节点,新序列长度为n=xi/10,共计得到1 507组速度序列数据,对其标准化处理得到数据集xi'即为车速预测模型实验数据,如图6所示。其中,横坐标为第i个数据点,纵坐标为标准化速度。

图5  滑动窗口采样示意图

Fig. 5  Schematic diagram of sliding window sampling

图6  实验数据现状

Fig. 6  Status of experimental data

统计2个模型的预测车速数据,对比情况如表4所示,以7类评价指标为切入点,可以看出:相对于原始的Bi-LSTM深度学习模型,经遗传算法优化后的GA-Bi-LSTM模型结构在车速预测方面具有明显优势,表现出更好的预测精度。

表4  模型总体评价指标对比
Table 4  Comparison of overall model evaluation indicators
指标Bi-LSTM14GA-Bi-LSTM提升或下降比例
R2 0.888 2 0.904 6 +0.016 4(↑1.64%)
Error Mean ⁃0.005 3 0.004 1 +0.009 4(↓177.36%)
Error StD 0.471 1 0.447 0 ⁃0.024 1(↑5.12%)
MSE 0.221 8 0.199 7 ⁃0.022 1(↑9.96%)
RMSE 0.470 9 0.446 9 ⁃0.024 0(↑5.10%)
NRMSE 0.080 6 0.076 5 ⁃0.004 1(↑5.09%)
0.945 3 0.949 5 +0.004 2(↑0.42%)

注:  黑体加粗表示最优指标

1)拟合优度R2。Bi-LSTM、GA-Bi-LSTM的R2分别为0.888 2和0.904 6,即GA-Bi-LSTM较Bi-LSTM整体提升了1.64%。显然,GA-Bi-LSTM速度预测模型的预测值拟合优度更高,预测值与原始值的相关性更高,即速度预测值更加接近实际值。

2)总体误差Error Mean、Error StD。Bi-LSTM、GA-Bi-LSTM的Error Mean分别为-0.005 3和0.004 1,两者差异明显,这是由于Error Mean计算过程中正负误差值相互抵消所致。Error StD分别为0.471 1和0.447 0,GA-Bi-LSTM较Bi-LSTM在Error StD层面提升了5.12%,表明GA-Bi-LSTM预测误差分布更为集中。

3)逐样本误差MSE、RMSE、NRMSE。Bi-LSTM的MSE、RMSE、NRMSE依次为0.221 8、0.470 9、0.080 6;GA-Bi-LSTM分别为0.199 7、0.446 9、0.076 5,GA-Bi-LSTM较Bi-LSTM的MSE、RMSE、NRMSE分别提升9.96%、5.10%、5.09%,说明GA-Bi-LSTM性能更为稳定,表现出更好的鲁棒性。

4)秩相关性rs。Bi-LSTM、GA-Bi-LSTM的秩相关结果分别为0.945 3、0.949 5,GA-Bi-LSTM相关性稍高,较Bi-LSTM提升了0.42%。

3.3 优化效果评价

最后,进行遗传算法优化效果评价,迭代次数设置为100次,优化过程如图7所示。遗传算法优化器分别迭代至第2、4、5次时,预测误差骤减;迭代至第6次时,模型开始收敛,迭代至99次时,模型持续收敛,得到最小误差、最佳超参数点。说明遗传算法的目标函数在评估成本高的任务时,可以较快速度收敛,能够应用于高峰时段合流区车速预测,表现出更好的泛化性与可靠性。

图7  超参数优化过程

Fig. 7  Hyperparameter optimization process

4 结束语

文中采用遗传算法对Bi-LSTM神经网络结构中的隐藏层单元数、学习率、隐藏层、L2正则化因子进行超参数优化,构建GA-Bi-LSTM速度预测模型。基于R2、Error Mean、Error StD、MSE等评价指标,与Bi-LSTM速度预测模型相比,GA-Bi-LSTM速度预测模型的预测精度更高,说明基于遗传算法优化的速度预测集成模型可有效适应与预测合流区高峰期复杂的速度特征,表现出更好的鲁棒性与泛化性。

参考文献

1

张鑫, 张卫华. 快速路合流区主线不同交通状态下的安全性分析[J].吉林大学学报(工学版),2022,52(6):1308-1314. [百度学术] 

Zhang X, Zhang W H. Safety analysis of main line under different traffic conditions in expressway confluence area[J].Journal of Jilin University(Engineering and Technology Edition), 2022,52(6):1308-1314.(in Chinese) [百度学术] 

2

帅斌, 米荣伟, 张锐, . 考虑驾驶行为异质性的城市快速路合流区仿真模型[J]. 交通运输系统工程与信息, 2022, 22(3): 267-275, 302. [百度学术] 

Shuai B, Mi R W, Zhang R, et al. Urban expressway merging area simulation model based on heterogeneity of driving behavior [J]. Journal of Transportation Systems Engineering and Information Technology, 2022, 22(3): 267-275, 302. (in Chinese) [百度学术] 

3

贺正冰, 徐瑞康, 谢东繁, . 数据驱动跟驰模型综述[J]. 交通运输系统工程与信息, 2021, 21(5): 102-113. [百度学术] 

He Z B, Xu R K, Xie D F, et al. A review of data-driven car-following models[J]. Journal of Transportation Systems Engineering and Information Technology, 2021, 21(5): 102-113.(in Chinese) [百度学术] 

4

徐进, 曾粤. 高速条件下隧道出入口行驶速度特性[J]. 交通运输工程学报, 2021, 21(4): 197-209. [百度学术] 

Xu J, Zeng Y. Characteristics of driving speed at tunnel entrance and exit at high speed[J]. Journal of Traffic and Transportation Engineering, 2021, 21(4): 197-209.(in Chinese) [百度学术] 

5

Williams B M, Hoel L A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: theoretical basis and empirical results[J]. Journal of Transportation Engineering, 2003, 129(6): 664-672. [百度学术] 

6

Mir Z H, Filali F. An adaptive Kalman filter based traffic prediction algorithm for urban road network[C]//2016 12th International Conference on Innovations in Information Technology (IIT). November 28-30, 2016, Al Ain, United Arab Emirates. IEEE, 2016: 1-6. [百度学术] 

7

Yao B Z, Chen C, Cao Q D, et al. Short-term traffic speed prediction for an urban corridor[J]. Computer-Aided Civil and Infrastructure Engineering, 2017, 32(2): 154-169. [百度学术] 

8

Zhao Z, Chen W H, Wu X M, et al. LSTM network: a deep learning approach for short-term traffic forecast [J]. IET Intelligent Transport Systems, 2017, 11(2): 68-75. [百度学术] 

9

Xu Y Y, Kong Q J, Klette R, et al. Accurate and interpretable Bayesian MARS for traffic flow prediction [J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(6): 2457-2469. [百度学术] 

10

Zheng L J, Yang J, Chen L, et al. Dynamic spatial-temporal feature optimization with ERI big data for Short-term traffic flow prediction [J]. Neurocomputing, 2020, 412: 339-350. [百度学术] 

11

Peng Y N, Xiang W L. Short-term traffic volume prediction using GA-BP based on wavelet denoising and phase space reconstruction[J]. Physica A: Statistical Mechanics and Its Applications, 2020, 549: 123913. [百度学术] 

12

Ma X L, Tao Z M, Wang Y H, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C: Emerging Technologies, 2015, 54: 187-197. [百度学术] 

13

Kim C, Batra R, Chen L H, et al. Polymer design using genetic algorithm and machine learning[J]. Computational Materials Science, 2021, 186: 110067. [百度学术] 

14

谢济铭,夏玉兰,秦雅琴,.基于双向长短期记忆网络的城市快速路合流区车速预测[J/OL].西南交通大学学报:1-92022-07-10].http://kns.cnki.net/kcms/detail/51.1277.U.20220705.2038.020.html. [百度学术] 

Xie J M, Xia Y L, Qin Y Q, et al. Traffic speed prediction in merging zone of urban expressway based on bidirectional long short-term memory network[J/OL]. Journal of Southwest Jiao tong University:1-92022-07-10].http://kns.cnki.net/kcms/detail/51.1277.U.20220705.2038.020.html.(in Chinese) [百度学术] 

15

Kline R B, Little T D. Principles and practice of structural equation modeling[M]. New YorkGuilford Press, 2011. [百度学术]