摘要
为提升交通流预测精度,深层次地挖掘交通流数据的时空特征,提出一种基于双向长短时记忆网络(Bi-LSTM)的城市交通网格集群流量预测模型。将所获得的网约车轨迹数据集网格化;考虑人为确定集群个数对结果的影响,用贝叶斯信息准则进行参数估计确定集群数,利用高斯混合模型对交通状况相似的网格进行聚类得到不同交通网格集群;利用集群内部交通网格的输入时间序列的相互影响设计多对多模型,构建Bi-LSTM模型预测不相交集群上的流量;以经典多元线性回归模型(MLRA)作为对照组进行实验验证,采用平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)和动态时间规整(DTW)这四类评价指标对预测结果进行综合评价,验证基于Bi-LSTM模型的城市交通网格集群流量预测的可行性。实验结果表明:MLRA模型和Bi-LSTM模型对城市交通网格集群流量的预测值小于真实值,早高峰时段尤为明显;各交通网格集群的交通状态态势相似,集群的簇内相关性较强,两类模型均可实现较好的流量预测效果,Bi-LSTM表现更优; MLRA和Bi-LSTM预测模型的精度MAE、RMSE、MAPE分别为3.2011、4.4009、0.3187,3.0687、4.2943、0.3045,Bi-LSTM与MLRA相比,模型精度分别提高了4.14%、2.40%、4.46%,说明所构建的Bi-LSTM交通流网格集群流量预测精度高、误差低,要优于MLRA模型,表现出较好的泛化性能; MLRA和Bi-LSTM的DTW结果分别为52938.6356、54815.1055,构建的Bi-LSTM模型较MLRA模型各自工作日和节假日时间序列相似性DTW结果提高3.42%,表现出更好的鲁棒性。利用城市交通流量的特点和交通轨迹数据网格化的优点,基于Bi-LSTM模型的城市交通网格集群流量预测与MLRA交通流量预测模型相比,具有精度高、误差低的特点。同时,DTW指标方面,基于Bi-LSTM对城市交通网格集群流量模型与真实流量变化趋势一致,表现出较好的鲁棒性。
智能交通系统(intelligent transport system, ITS)是智慧城市的重要组成部分,可有效解决交通拥堵问题,城市交通流量预测是ITS的基石,精准高效的交通流量预测对缓解交通拥堵具有重要意
早期交通流量预测是基于统计学模型的方法。Vythoulka
Zhang
针对交通流量数据的非线性和不确定性增加、复杂庞大的连续数据特征难以提取、交通轨迹数据的隐含特征提取不充分问题,笔者提出基于深度学习的交通流量预测方法,引入双向长短时记忆网络模型(bidirectional long short-term memory network, Bi-LSTM),贡献如下:
1)网格化处理和交通网格集群建模:通过将交通轨迹数据进行网格化处理,将复杂庞大的连续数据转化为网格化的交通网格集群。利用贝叶斯信息准则(bayesian information criterion, BIC)和GMM模型,将网格化的交通流量数据序列分解为若干个加速度、速度比率、平均停车次数等相似交通状况的网格集群,有效提取交通网格集群的时空特征,深入挖掘路网的时空关联性。
2)设计多对多模型进行序列预测:全面考虑交通网格之间的相互影响和时序关系,设计了多对多模型,将分解得到的交通网格集群作为Bi-LSTM的输入,实现对网格集群交通流量的序列预测。
3)通过使用滴滴盖亚数据开放计划的数据集进行实验,实验结果表明,基于Bi-LSTM的城市交通网格集群流量预测具有良好的预测能力,且优于基准模型。
基于多对多模型设计思想,构建Bi-LSTM预测模型对城市交通流网格集群流量进行预测。考虑输入的交通网格集群序列遵循正态分布,为便于计算,对各个集群进行标准化处理;交通网格集群可用的时序数据可确定2个网格之间的时间和空间相关性,使所输入数据具有较强的时空关联,利用多对多模型设计将分解的若干个交通网格集群作为Bi-LSTM的输入;根据预测精度调整Bi-LSTM模型相关参数权重,以此预测n时刻该交通网格集群每个网格未来的交通流量。基于Bi-LSTM对城市交通网格集群流量模型预测框架如

图 1 基于Bi-LSTM对城市交通网格集群流量模型预测框架
Fig. 1 Prediction model framework for urban traffic rasters cluster flow based on Bi-LSTM
交通传播模式是在一个道路网络中特定路段的流量水平所拥有的时空关

图 2 网格流量图
Fig. 2 Grid flow diagram
交通网格可用的时序数据可确定2个网格之间的时空相关性,得到t时刻当前网格的交通流量对其它网格影响。考虑到多对多模型对整个交通网络的交通流量预测效率更

图 3 多对多模型设计
Fig. 3 Multi-to-Multi model design
交通流量当前状态不仅与之前的状态有关,还与未来的状态有关。Bi-LSTM具有较强的序列建模能力,可以对交通数据的时间序列特征进行建模和预测,包括小时、天、周等不同时间尺度。Bi-LSTM其结构由上下堆叠的2个单向LSTM组成,输入在2个方向流

图 4 Bi-LSTM结构图
Fig. 4 Bi-LSTM structure diagram
求解时分别计算前项隐向量产生新的隐向量,如
, | (1) |
, | (2) |
, | (3) |
, | (4) |
式中:和分别为t时刻流量序列前向传播层和后向传播层中隐藏层的输出;和表示每一层连接到前一个隐藏状态的权重矩阵,表示偏置项。
研究的数据集来源于滴滴出行设立的盖亚数据开放计划平台,地理区域是四川省成都市二环内局部范围,原始数据大小约180 GB,轨迹点采集间隔为2-4 s,时间区间是某年11月1日-30日,轨迹数据与实际路段相对应。司机及乘客订单的隐私信息进行了加密脱敏匿名化处理可保证用户安全。为了使轨迹数据更加集中,便于提取时空特征,对大规模杂乱轨迹数据进行清洗、错误筛查、压缩等处理,处理前后区域范围如

图 5 处理前后区域范围
Fig. 5 Range of areas before and after treatment
大规模轨迹数据时空相关性较强,其时间数据只有一维属性且具有严格的序列性,空间数据具有多维属性且空间相关性更复杂。网格划分可高效地挖掘数据中隐含的时空特征,对不同类别的时空数据进行融

图 6 时空网格划分
Fig. 6 Spatiotemporal gridding
基于Bi-LSTM的城市交通网格集群流量进行预测,确定交通网格的最佳集群数是进行GMM模型聚类的基础。为避免人为确定最佳集群数对实验结果产生影响,利用BIC进行参数估计确定交通网格最优集群数k。
很多参数估计问题采用似然函数作为目标函数,当训练数据集足够大时,该方法可不断提高模型的精度,但也会随着模型复杂度增加而出现过拟合问
, | (5) |
式中:为模型参数的个数;为样本数量;为似然函数;惩罚项在维数过大且训练样本数据相对较少的情况下,可有效避免维度灾难现象。
BIC倾向于选择较小的值,而模型参数的个数k过大会导致模型出现过拟

图 7 模型参数个数与BIC值关系图
Fig. 7 Number of GMM model parameters versus BIC value
某种程度上GMM模型是改进型的K-means模型。K-means模型的作用是将数据收集到方差相等的组中,使组内总和最
, | (6) |
式中:为概率密度函数;k表示k个混合成分组成,每个混合成分对应一个高斯分布;与是第个高斯混合成分的参数;为相应的“混合系数”,。
利用K-means迭代获取最优值后将聚类中心点作为GMM的初始值进行训练,以避免GMM收敛到局部最优解;在GMM聚类时,利用EM算法估算参数使每个分量都有自己的通用协方差矩阵。

图 8 交通网格聚类示意图
Fig. 8 traffic condition grid clustering diagram
使用1~24日的数据作为练数据,25~30日的数据作为测试数据,取训练集的15%作为验证集,利用过去1 h的交通流量数据(6个时间步长)来预测未来10 min(1个时间步长)的交通流量。采用Python语言进行编程,该程序使用Keras库,在AMD Ryzen 7 5800H with Radeon Graphics处理器、16gb内存、Window10操作系统和Tensorflow2.0深度学习框架上实现。经过GMM聚类后所生成的交通网格集群利用多对多模型输入Bi-LSTM模型进行训练。Bi-LSTM设计有6个隐藏层,前两层是bi-lstm层,各有64个神经元;第三层有32个神经元;第四层16个神经元;第五层为dropout层,为防止模型过拟合,丢弃率设为0.2;最后一层为全连接层。LSTM模型学习率为0.001,损失函数使用MSE,反向传播算法使用Adam优化器,激活函数采用ReLU。由于不同集群的交通状况不一致,故每批次所训练的样本数(batch sizes)、总迭代次数(epoches)和训练时间(times)如
批次数 | 64 | 64 | 256 | 256 | 64 | 16.0 |
迭代次数 | 98 | 36 | 179 | 71 | 68 | 39.0 |
训练时间t/s | 522 | 291 | 1030 | 727 | 152 | 77.6 |
利用过去1 h的交通数据预测未来10 min的交通流量,

图 9 模型预测结果对比
Fig. 9 Comparison of prediction results of models
MLRA预测结果 Bi-LSTM预测结果
从
模型时间序列相似性结果:

图 10 工作日时间序列相似性结果
Fig. 10 Time series similarity results(working day)

图 11 节假日时间序列相似性结果
Fig. 11 Time series similarity results(holiday)
从
为量化模型预测结果,采用经典的误差评价指
1) MAE:用于评估交通流量预测值和真实值的接近程度,其值越小拟合效果越好,
。 | (7) |
2) RMSE:该指标计算的是交通流量预测结果和真实值对应样本点误差的平方根,其值越小说明预测速度值精度越高,
。 | (8) |
3)MAPE:用于测量测试集上平均流量测试值与实际测试值之间的相对误差,范围[0,+∞),MAPE为0%表示完美模型,MAPE大于100 %则表示劣质模型,
, | (9) |
式中:为预测值;为实际值;为平均值。
4) DTW:用于测量交通流量预测值和真实值2个时间序列之间的相似性,所得到的距离越小,说明2个时间序列越相似。
, | (10) |
将2个流量预测值x和真实值y拉伸到一个共同的时刻集合上,使得对应点之间的欧几里得距离之和最小。返回共同翘曲路径,使得流量预测值和真实值之间距离尽可能小。限制扭曲路径在流量预测值x和真实值y之间拟合的最大样本范围内。指定除前面语法中的任何输入参数之外要使用的距离度量。交通流量预测值和真实值2个时间序列之间的相似性结果。
不同模型和集群的评价结果如
评价指标 | MLRA | Bi-LSTM | |
---|---|---|---|
MAE | 3.085 2 | 2.988 7 | |
RMSE | 4.802 | 4.725 1 | |
MAPE | 0.140 5 | 0.138 7 | |
DTW | 20 407.815 1 | 19 811.135 6 | |
MAE | 2.285 3 | 2.326 8 | |
RMSE | 3.027 5 | 3.075 4 | |
MAPE | 0.415 5 | 0.432 8 | |
DTW | 30 479.499 3 | 30 473.800 1 | |
MAE | 3.119 5 | 3.273 9 | |
RMSE | 4.320 9 | 4.493 6 | |
MAPE | 0.370 4 | 0.389 7 | |
DTW | 75 837.802 4 | 72 737.685 4 | |
MAE | 3.753 9 | 3.885 5 | |
RMSE | 5.485 6 | 5.526 7 | |
MAPE | 0.141 6 | 0.143 4 | |
DTW | 103 322.079 8 | 99 625.153 7 | |
MAE | 3.268 | 3.464 7 | |
RMSE | 4.235 | 4.338 2 | |
MAPE | 0.261 | 0.275 6 | |
DTW | 5 367.451 5 | 5 343.821 6 | |
MAE | 2.481 6 | 2.678 5 | |
RMSE | 3.472 3 | 3.593 9 | |
MAPE | 0.473 4 | 0.509 9 | |
DTW | 1 522.672 2 | 1 517.951 2 |
Models | MAE | RMSE | MAPE | DTW |
---|---|---|---|---|
MLRA | 3.201 1 | 4.400 9 | 0.318 7 | 52 938.635 6 |
Bi-LSTM | 3.068 7 | 4.294 3 | 0.304 5 | 54 815.105 5 |
模型提升比例 | +4.14% | +2.42% | +4.46% | +3.42% |
模型精度:模型的平均评价结果如
1)Bi-LSTM与MLRA相比,MAE降低0.1324,提高4.14%,Bi-LSTM的流量预测值较为接近真实值,拟合效果较好;
2)Bi-LSTM与MLRA相比,RMSE降低0.1066,提高2.42%,Bi-LSTM模型的交通流量预测结果和真实值对应样本点的误差平方根较小,预测精度比经典MLRA模型流量预测高,预测效果较好;
3)Bi-LSTM与MLRA相比,MAPE降低0.0142,提高4.46%,Bi-LSTM模型的测试集上平均流量测试值与实际测试值之间的相对误差小,说明Bi-LSTM模型优于MLRA模型。
DTW结果:
Bi-LSTM模型较经典MLRA模型在对交通网格集群进行流量预测时表现出较好的泛化性和鲁棒性,Bi-LSTM在交通流量集群预测方面比MLRA模型更有优势。
在Tensorflow2.0深度学习的理论框架下,基于Python语言,利用贝叶斯信息准则和高斯混合模型,将网格化的交通流量数据序列分解为若干个相似交通状况的网格集群,设计了多对多模型,根据交通网格可用的时间序列数据,构建了基于Bi-LSTM交通流量时间序列预测框架,借助Keras完成逐层网络构建和精细化调参,实现基于Bi-LSTM对城市交通网格集群的短时交通流预测。Bi-LSTM模型较MLRA模型在MAE、MSE、MAPE方面分别提高了4.14%、2.40%、4.46%,Bi-LSTM模型表现出更好的泛化性能。2个时间序列之间相似性表现出的DTW结果为Bi-LSTM组合预测模型较MLRA模型提高了3.42%,Bi-LSTM要优于MLRA,表现出较好的鲁棒性。说明基于Bi-LSTM对城市交通网格集群流量预测是可行的,具有应用于城市交通网格流量预测的潜力。
参考文献
刘宜成, 李志鹏, 吕淳朴, 等. 基于动态时间调整的时空图卷积路网交通流量预测[J]. 交通运输系统工程与信息, 2022, 22(3): 147-157, 178. [百度学术]
Liu Y C, Li Z P, Lv C P, et al. Network-wide traffic flow prediction research based on DTW algorithm spatial-temporal graph convolution[J]. Journal of Transportation Systems Engineering and Information Technology, 2022, 22(3): 147-157, 178.(in Chinese) [百度学术]
Chen C L, Liu Y B, Chen L, et al. Bidirectional spatial-temporal adaptive transformer for urban traffic flow forecasting[J]. IEEE Transactions on Neural Networks and Learning Systems, 2022, PP(99): 1-13. [百度学术]
Vythoulkas P. Alternative approaches to short term traffic forecasting for use in driver information systems[J]. Transportation and Traffic Theory, 1993, 12: 485-506. [百度学术]
Ahmed M S. Analysis of freeway traffic time series data and their application to incident detection[M]. OKlahoma;The University of Oklahoma, 1979. [百度学术]
Feng X X, Ling X Y, Zheng H F, et al. Adaptive multi-kernel SVM with spatial–temporal correlation for short-term traffic flow prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(6): 2001-2013. [百度学术]
Lee J W, Hong B, Lee K, et al. A prediction model of traffic congestion using weather data[C]//2015 IEEE International Conference on Data Science and Data Intensive Systems. December 11-13, 2015. Sydney, NSW, Australia:IEEE, 2016: 81-88. [百度学术]
Zhang W B, Yu Y H, Qi Y, et al. Short-term traffic flow prediction based on spatio-temporal analysis and CNN deep learning[J]. Transportmetrica a Transport Science, 2019, 15(2): 1688-1711. [百度学术]
Fu R, Zhang Z, Li L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). November 11-13, 2016.Wuhan, China:IEEE, 2017: 324-328. [百度学术]
Zheng C P, Fan X L, Wang C, et al. GMAN: a graph multi-attention network for traffic prediction[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(1): 1234-1241. [百度学术]
Wang Z Y, Thulasiraman P, Thulasiram R. A dynamic traffic awareness system for urban driving[C]//2019 International Conference on Internet of Things (iThings), IEEE Green Computing and Communications (GreenCom), IEEE Cyber, Physical, Social Computing (CPSCom) and IEEE Smart Data (SmartData), July 14-17, 2019.Atlanta, GA, USA: IEEE, 2019: 945-952. [百度学术]
Wang Z Y, Thulasiraman P. Foreseeing congestion using LSTM on urban traffic flow clusters[C]//2019 6th International Conference on Systems and Informatics (ICSAI). November 2-4, 2019, Shanghai, China. IEEE, 2020: 768-774. [百度学术]
Chiabaut N, Faitout R. Traffic congestion and travel time prediction based on historical congestion maps and identification of consensual days[J]. Transportation Research Part C: Emerging Technologies, 2021, 124: 102920. [百度学术]
Long J C, Gao Z Y, Ren H L, et al. Urban traffic congestion propagation and bottleneck identification[J]. Science in China Series F: Information Sciences, 2008, 51(7): 948-964. [百度学术]
Chen K H, Jia J P. Network evasion detection with Bi-LSTM model[J]. Journal of Physics: Conference Series, 2019, 1168: 052009. [百度学术]
刘志远, 张文波. 交通大数据: 理论与方法[M]. 杭州: 浙江大学出版社, 2020. [百度学术]
Liu Z Y, Zhang W B. Traffic big data: theory and method[M]. Hangzhou: Zhejiang University Press, 2020.(in Chinese) [百度学术]
赵杨璐, 段丹丹, 胡饶敏, 等. 基于EM算法的混合模型中子总体个数的研究[J]. 数理统计与管理, 2020, 39(1): 35-50. [百度学术]
Zhao Y L, Duan D D, Hu R M, et al. On the number of components in mixture model based on EM algorithm[J]. Journal of Applied Statistics and Management, 2020, 39(1): 35-50.(in Chinese) [百度学术]
Schwarz G. Estimating the dimension of a model[J]. The Annals of Statistics, 1978,6(2): 461-464. [百度学术]
Likas A, Vlassis N, Verbeek J J. The global K-means clustering algorithm[J]. Pattern Recognition, 2003, 36(2): 451-461. [百度学术]
Reynolds D. Gaussian mixture models[M]. Boston, MA: Springer, 2009: 659-663. [百度学术]
王博文, 王景升, 王统一, 等. 基于长短时记忆网络的Encoder-Decoder多步交通流预测模型[J]. 重庆大学学报, 2021, 44(11): 71-80. [百度学术]
Wang B W, Wang J S, Wang T Y, et al. An encoder-decoder multi-step traffic flow prediction model based on long short-time memory network[J]. Journal of Chongqing University, 2021, 44(11): 71-80.(in Chinese) [百度学术]