网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于卷积神经网络与门控循环单元的交通流预测模型  PDF

  • 王博文 1
  • 王景升 1
  • 王统一 3
  • 夏天雨 2
  • 赵丹婷 1
1. 中国人民公安大学,交通管理学院,北京 100038; 2. 中国人民公安大学,信息网络安全学院,北京 100038; 3. 山东科技大学 电气信息系,济南 250000

中图分类号: TP183U491.14

最近更新:2023-08-24

DOI:10.11835/j.issn.1000-582X.08.013

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

为对交通流进行多步预测,支持智能交通系统的长期决策任务,一种基于编码器 -解码器(encoder-decoder, ED)的卷积神经网络(convolutional neural networks, CNN)-门循环 单元(gate recurrent unit, GRU)模型,简称 ED CNN-GRU。首先使用 CNN 作为编码器,对交 通流序列进行信息捕捉,再将上述信息通过 GRU 解码器进行解释并输出。实验证明,对比 CNN、GRU 单个模型,ED 框架有效解决了误差的迅速累积问题。对比其他基准模型,CNN、 GRU 模型对于交通流序列的特征提取及解释能力较为优秀。对于未来 12 个步长的交通流量 预测任务,对比其他基准模型,单因素输入情况的 ED CNN-GRU 模型的均方根误差下降约 0.344~6.464,平均绝对误差下降约 0.192~0.425。对比单因素输入,多因素输入下 ED CNN-GRU 模型拥有更好的预测能力。证明了 ED CNN-GRU 模型在不同输入维度的多步交通流预测中任务中均具有良好的预测能力,为数据获取条件不同的城市提供了一个支持单因素及多因素输入情况的多步交通流预测模型。

交通拥堵、尾气排放等问题致使城市交通管理任务日益艰巨。智能交通系统(intelligent traffic system, ITS)作为一种关键技术,可有效解决现有交通问题。准确预测交通流变化趋势是使用ITS对城市交通进行控制、诱导的前提和基础。

为提高ITS的决策能力,研究者提出大量基于统计学模型和机器学习模型的交通流预测模[

1⁃4]。Williams等[5]使用自回归积分滑动平均应用于单变量的交通流序列预测任务,得到很好拟合效果。刘钊等[6]利用K近邻的搜索原理对历史交通流序列进行重构后使用支持回归向量机对数据进行拟合提升预测准确性。随着智慧交通的发展,城市交通产生的数据量急剧增长,交通流的非线性特征逐渐突出,研究人员尝试使用深度学习方法,以数据驱动方式对交通流序列进行拟[7⁃10]。孔繁辉等[11]使用深度信念网络对传统神经网络进行优化,构建有效的交通流预测模型。温惠英等[12]使用遗传算法对长短时间记忆网络的隐藏层数、训练次数等参数进行寻优,应用到高速公路的交通流量预测任务中,证明了深度学习模型对于交通流序列的拟合能力较传统模型及浅层机器学习更优秀。循环神经网络(recurrent neural network, RNN)类网络在时间序列预测问题上有较好效[13]。Fu等[14]使用门循环单元(gate recurrent unit, GRU)对交通流序列进行拟合,证明相对于传统线性算法,深度学习相关算法更能够挖掘交通流序列中的非线性关系。Li等[15]对长短期记忆网络进行改进,将其用于电池的剩余寿命预测问题中,模型表现出较好预测效果。但是单一的神经网络模型在对长时间序列进行预测时,预测误差会随着预测步长增加快速累积,导致预测结果无效。因此大多数研究仅适用于单步交通流预测,无法辅助ITS进行长期决策任务。为解决上述问题,采用编码器-解码器(encoder-decoder, ED)框架,通过编码器将历史交通流信息压缩成一个固定维度的状态向量,使用解码器对该状态向量进行解释,ED框架通过递归方式将预测结果反馈到网络中,以此减缓误差的迅速累积,实现多步预测。

交通流包含交通流量、密度、交通速度等多个因素,在进行交通流预测任务时,应该将交通流序列多因素之间的相互影响纳入考虑范围。卷积神经网络(convolutional neural network, CNN)能够对多个时间序列特征进行有效提取。在对较长时间序列进行拟合时,相较于其他基准深度学习模型,GRU表现出更为优秀的预测效果。因此考虑使用CNN对交通流序列进行特征提取,并将提取到的特征输入GRU进行解释。

因此,笔者提出一种新的预测模型,将其命名为“encoder-decoder structure CNN-GRU combined model”,简称ED CNN-GRU,以此实现对交通流序列的多步预测。主要创新:

1)使用ED框架,以CNN为编码器将输入序列转换为固定长的向量,通过一个GRU解码器将生成的向量转化为输出序列,以此解决多步预测中误差迅速累积问题。

2)使用CNN对交通流序列进行特征提取,将提取结果输入GRU进行解释并输出,提高模型的拟合能力。

3)基于真实交通数据集,将传统统计模型:自回归滑动平均(auto-regressive and moving average, ARMA)、浅层机器学习模型:SVR、极端梯度提升(extreme gradient boosting, XGBOOST)、基准深度学习模型:RNN、CNN、GRU模型作为对照组进行实验验证。实验结果表明ED CNN-GRU模型在单个、多个因素的输入情况下对交通流序列均具备较好解释效果。

1 相关技术

1.1 CNN模型

卷积神经网络(convolutional neural networks, CNN)是人工神经网络的一种。一维CNN能够对时间序列进行特征提取。已知序列A={a0,a1,a2,…,am},L(A)=m+1,B={b0,b1,b2,…,bk},L(B)=k+1。用C表示AB 2个序列进行卷积操作后得到的新序列,计算公式为

C=A*B=a0bn+a1bn-1++an-1b1+anb0=akbn-k (1)
LC=L(A)+L(B)-1 (2)

式中:*为卷积操作;L(C)、L(A)、L(B)分别为序列CAB的长度。

CNN提取时间序列特征,就是找到一个长度为m的序列作为滤波器,与原时间序列做卷积、池化操作,得到深层的序列表达。CNN模型的框架如图1所示。

图1  CNN模型框架

Fig. 1  CNN model framework

1.2 GRU模型

门控循环网络(gate recurrent unit, GRU)与长短期记忆网络(long short-term memory,LSTM)的结构相似,GRU将LSTM的输入门与遗忘门进行整合,形成更新门配合重置门对网络进行优化。相较于LSTM,GRU的网络结构较为简单,计算速度快。

GRU提取数据特征的过程如下:

通过重置门对隐藏状态的部分信息进行计算

rt=σWrht-1,xt (3)

式中:rtt时刻重置门的输出;σ为sigmoid激活函数;Wr为重置门学习到的权重矩阵;ht-1t-1时刻记忆单元的状态;xtt时刻记忆单元的输入。

使用更新门对t-1时刻的隐藏状态进行映射,使用sigmoid函数将数据约束在[0,1],在t时刻更新门的输出为

zt=σWzht-1,xt , , (4)

式中:ztt时刻更新门的输出;WZ为更新门学习到的权重矩阵。

将重置门的输出与t-1时刻的隐藏状态相乘再与xt进行映射,使用tanh函数将数据约束在[-1,1]输出候选隐藏状态的记忆内容

ht^=tanhWhrtht-1,xt , (5)

式中:tanh为激活函数;Wh为候选隐藏状态学习到的权重矩阵;⊗为向量间的乘法。

将上述记忆内容与当前时刻记忆内容进行叠加得到该时刻的单元状态

ht=ztht-1+1-zth^t (6)

GRU的内部结构如图2所示。

图2  GRU的内部结构

Fig. 2  The internal structure of the GRU

1.3 Encoder-Decoder结构

编码器-解码器结构(encoder-decoder)可用于长时间序列预测,通过将长时间序列编码表示为一段向量,并且将所给的向量表示解码为变长序列,解决误差随着预测步长逐渐累积问题。

2 基于ED

CNN-GRU模型的预测方法

研究模型结构如图3所示。

图3  研究模型的结构

Fig. 3  The structure of model in this paper

输入数据先经过由2个卷积层和一个池化层的CNN组成的编码器,使用全连接层将输出结果平坦化,将输出数据通过RepeatVector层进行重复后输入由单层GRU构成的解码器,最后将数据通过2个TimeDistributed包装器进行输出。CNN及GRU的隐藏层均为64个神经元,第一个TimeDistributed包装器为8个神经元,第二个TimeDistributed包装器的神经元个数与预测步长相等。

ED CNN-GRU模型的建模步骤如下:

1)使用Min-Max归一化对交通流序列进行数据规约;

2)以8:2的比例划分训练集和测试集;

3)以8个时间步长作为滑动窗口进行训练数据读取,输入ED CNN-GRU模型进行训练;

4)保存并使用训练好的ED CNN-GRU模型以8个时间步长作为滑动窗口进行测试数据读取,模型测试;

5)将输出的原始预测数据进行反归一化后进行误差计算。

3 实例验证

3.1 数据来源

基于PEMS-04进行实例验证,该数据集为美国加利福尼亚州第4区高速公路的某路段2018年1月1日~2018年6月13日的交通流量、平均速度数据,样本的时间间隔为5 min,处理为每日早高峰至晚高峰时段的数据,即7:00-19:00。

3.2 数据预处理

在进行建模前,为提升模型的收敛速度及预测准确度,使用Min-Max将数据归一化至[0,1]。并以8:2划分训练集和测试集。

3.3 模型的参数设置及评价指标选取

3.3.1 模型的参数设置

深度学习模型均使用TensorFlow深度学习框架构建。基准深度学习模型的隐藏层个数均为1,神经元个数为64,损失函数选择MSE,优化器选择Adam,激活函数选择Relu,batch_size=64,其余参数均为默认 [

16⁃17]。迭代次数设置为100,同时使用Compile方法进行学习,当检测到损失函数停止改进或迭代次数为100时结束训练。ARMA[18]、SVR[19]、XGBOOST[20]模型分别使用Statsmodels、Sklearn、Xgboost库建立,参数均为默认值。

3.3.2 评价指标选取

均方根误差(root mean squard error,RMSE)和平均绝对误差(mean absolute error,MAE)被用于评价模型的拟合效[

21],RMSE、MAE值越小,模型表现越优秀。

3.4 实验设计与评价

分别构建单变量输入的ARMA、SVR、XGBOOST、RNN、CNN、GRU、ED CNN-GRU模型,及多变量输入的ED CNN-GRU模型,使用PEMS-04数据集进行实验验证,单变量模型输入特征为交通流量,多变量模型输入特征为交通流量、平均速度。使用前8个历史数据对未来12个时间步长的交通流量进行拟合。模型在未来12个时间步长的平均RMSE和MAE值详见表1

表1  各个模型在12个时间步长内的平均RMSEMAE
Table 1  The average RMSE and MAE of each model in 12 time steps
模型PEMS-04
RMSEMAE
ARMA 53.123 5.992
SVR 52.445 5.965
XGBOOST 51.799 5.977
RNN 51.158 5.982
CNN 50.359 5.919
GRU 48.331 5.859
ED CNN-GRU(Univariate) 47.003 5.759
ED CNN-GRU(Multivariate) 46.659 5.567

表1得,在未来12个时间步长内,较传统统计模型及浅层机器学习模型,单变量输入的ED CNN-GRU模型RMSE及MAE分别下降0.344~6.464、0.192~0.425。相较单变量输入,多变量输入的ED CNN-GRU模型的平均RMSE及MAE分别下降0.344、0.192。除此外,深度学习模型对交通流序列拥有较好的拟合能力,CNN、GRU模型效果优于RNN模型,说明相较其他基准模型,CNN、GRU能有效对时间序列特征进行提取。

为进一步分析模型在每一个时间步长上的拟合效果,使用前8个历史数据对未来12个时间步长之间特定步长的交通流量进行拟合。模型在多个特定时间步长下的平均RMSE和MAE值详见表2

表2  模型在多个特定时间步长下的平均RMSEMAE
Table 2  Average RMSE and MAE of the model at multiple specific time steps
模型PEMS-04
RMSEMAE
t+1t+3t+6t+12t+1t+3t+6t+12
ARMA 38.243 43.418 53.122 64.985 5.051 5.431 5.917 6.697
SVR 37.753 42.509 52.311 64.162 5.043 5.405 5.891 6.681
XGBOOST 37.664 42.013 51.507 63.442 5.084 5.402 5.994 6.721
RNN 34.815 41.773 50.724 63.403 5.038 5.397 5.981 6.672
CNN 34.839 41.682 49.143 62.043 5.032 5.341 5.903 6.632
GRU 34.831 40.839 48.933 59.482 5.043 5.337 5.895 6.581
ED CNN-GRU(Univariate) 33.636 40.408 48.417 56.508 4.923 5.269 5.808 6.397
ED CNN-GRU(Multivariate) 33.608 40.227 46.479 56.338 4.158 4.787 5.737 6.360

表2得,随着预测步长增加,模型性能受到不同程度影响。相较于传统统计模型及浅层机器学习模型,单变量输入的ED CNN-GRU模型在预测步长为t+1、t+3、t+6、t+12情况下均具有最小的RMSE及MAE。相较于单变量输入,多变量输入ED CNN-GRU模型的RMSE与MAE存在进一步下降。除此之外,随着预测步长增加相较于CNN、GRU等对照组模型,研究模型的拟合效果下降最缓慢,证明了ED框架可以有效减缓误差的迅速累积,使用ED框架搭建的预测模型能够有效完成多步预测任务。

分别绘制预测时间步长为t+1和t+6时,单变量输入下的RNN、CNN、GRU、ED CNN-GRU模型及多变量输入下的ED CNN-GRU模型在训练集上的拟合曲线如图4所示。在单变量输入下ARMA、SVR、XGBOOST、RNN、CNN、GRU、ED CNN-GRU模型在测试集上的拟合曲线如图5所示。分别绘制预测时间步长为t+1和t+6时,单变量、多变量输入条件下ED CNN-GRU模型在测试集上的拟合曲线如图6所示。

  

  

图4  模型在t+1t+6时间步长下在训练集上的损失曲线

Fig. 4  The loss curve of the model on the training set at t+1 and t+6 time steps

图5  模型在t+1t+6时间步长下在测试集上的拟合曲线

Fig. 5  The fitting curve of the model on the test set at t+1 and t+6 time steps

图6  不同输入状态的ED CNN-GRU模型在t+1t+6时间步长下在测试集上的拟合曲线

Fig. 6  The fitting curves of ED CNN-GRU models with different input states on the test set at t+1 and t+6 time steps

图5⁃6得,无论在曲线的最值还是平峰处,ED CNN-GRU模型在不同的输入条件下均能够获取较好预测结果,同时相较单变量输入,ED CNN-GRU模型在多变量输入条件下能获取更好预测效果,为数据获取条件不同的城市提供了一个支持单变量及多变量输入的交通流预测模型。

4 结 论

笔者使用ED框架将CNN、GRU进行有效连接,通过进行多组实验证明了该建模方式的有效性:

1)相较于CNN、GRU单个模型,ED框架有效解决了误差的迅速累积;

2)相较于其他基准模型,CNN、GRU模型对于交通流序列的特征提取及解释能力较为优秀;

3)证明了ED CNN-GRU模型在单变量、多变量交通流序列的输入下均有较好预测效果,且在多个交通流时间序列输入的情况下预测效果最佳。为数据获取条件不同的城市提供了一个支持单变量及多变量输入的多步交通流预测模型。

参考文献

1

姚博凡,邓如丰,熊宸,.基于时空特征向量的城市快速路交通状态长时段预测[J].中山大学学报(自然科学版),2021,60(3):115-123. [百度学术] 

Yao B F, Deng R F, Xiong C, et al. Long-term traffic status prediction of urban expressway based on spatio-temporal eigenvector[J]. Acta Scientiarum Naturalium Universitatis Sunyatseni,2021,60(3):115-123.(in Chinese) [百度学术] 

2

黄敏,毛锋,钱宇翔,.基于Dropconnect的CorrelationNet预测乘客出租车需求[J].中山大学学报(自然科学版),2020,59(2):86-94. [百度学术] 

Huang M, Mao F, Qian Y X, et al. Passenger taxi boarding demand prediction via CorrelationNet with Dropconnect[J]. Acta Scientiarum Naturalium Universitatis Sunyatseni,2020,59(2):86-94.(in Chinese) [百度学术] 

3

李欣.基于Spark的多阶空间权重矩阵STARIMA交通流预测分析方法[J].中山大学学报(自然科学版),2018,57(6):41-49. [百度学术] 

Li X. Spark-based traffic flow prediction analysis using multi-order spatial weighting matrix STARIMA[J]. Acta Scientiarum Naturalium Universitatis Sunyatseni,2018,57(6):41-49.(in Chinese) [百度学术] 

4

梁艳平,毛政元,邹为彬,.基于相似数据聚合与变K值KNN的短时交通流量预测[J].地球信息科学学报,2018,20(10):1403-1411. [百度学术] 

Liang Y P, Mao Z Y, Zou W B, et al. Short-term traffic flow prediction based on similar data aggregation and KNN with varying K-value[J]. Journal of Geo-information Science,2018,20(10):1403-1411.(in Chinese) [百度学术] 

5

Williams B M, Hoel L A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: theoretical basis and empirical results[J]. Journal of Transportation Engineering, 2003, 129(6): 664-672. [百度学术] 

6

刘钊,杜威,闫冬梅,.基于K近邻算法和支持向量回归组合的短时交通流预测[J].公路交通科技,2017,34(5):122-128, 158. [百度学术] 

Liu Z, Du W, Yan D M, et al. Short-term traffic flow forecast based on combination of K nearest neighbor algorithm and support vector regression[J]. Journal of Highway and Transportation Research and Development,2017,34(5):122-128-158.(in Chinese). [百度学术] 

7

Wang B, Wang J, Zhang Z, et al. Traffic flow prediction model based on deep learning[C]//International Conference on Man-Machine-Environment System Engineering. Singapore: Springe, 2021: 739-745. [百度学术] 

8

王博文,王景升,朱茵,.基于ARMA-SVR的短时交通流量预测模型研究[J].公路交通科技,2021,38(11):126-133. [百度学术] 

Wang B W, Wang J S, Zhu Y, et al. Study on short-term traffic volume prediction model based on ARMA-SVR[J]. Journal of Highway and Transportation Research and Development,2021,38(11):126-133.(in Chinese) [百度学术] 

9

戢晓峰,戈艺澄.基于深度学习的节假日高速公路交通流预测方法[J].系统仿真学报,2020,32(6):1164-1171. [百度学术] 

Ji X F, Yi Y C. Holiday highway traffic flow prediction method based on deep learning[J]. Journal of System Simulation,2020,32(6):1164-1171.(in Chinese) [百度学术] 

10

刘明宇,吴建平,王钰博,.基于深度学习的交通流量预测[J].系统仿真学报,2018,30(11):4100-4105, 4114. [百度学术] 

Liu M Y, Wu J P, Wang Y B, et al. Traffic flow prediction based on deep learning[J]. Journal of System Simulation,2018,30(11):4100-4105, 4114.(in Chinese) [百度学术] 

11

孔繁辉,李健.深度信念网络优化BP神经网络的交通流预测模型[J].管理评论,2020,32(3):300-306. [百度学术] 

Kong F H, Li J. Traffic flow prediction model based on deep belief network optimized BP neural network[J]. Management Review,2020,32(3):300-306. ,2020,32(3):300-306.(in Chinese) [百度学术] 

12

温惠英,张东冉,陆思园.GA-LSTM模型在高速公路交通流预测中的应用[J].哈尔滨工业大学学报,2019,51(9):81-87. [百度学术] 

Wen H Y, Zhang D G, Lu S Y. Application of GA-LSTM model in highway traffic flow prediction[J]. Journal of Harbin Institute of Technology,2019,51(9):81-87.(in Chinese) [百度学术] 

13

Li P, Zhang Z, Grosu R, et al. An end-to-end neural network framework for state-of-health estimation and remaining useful life prediction of electric vehicle lithium batteries[J]. Renewable and Sustainable Energy Reviews, 2022, 156: 111843. [百度学术] 

14

Fu R, Zhang Z, Li L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). IEEE, 2016: 324-328. [百度学术] 

15

Li P, Zhang Z, Xiong Q, et al. State-of-health estimation and remaining useful life prediction for the lithium-ion battery based on a variant long short term memory neural network[J]. Journal of Power Sources, 2020, 459: 228069. [百度学术] 

16

Lu Z, Lv W, Xie Z, et al. Highway traffic volume prediction via stacking KNN, SVR, MLP, RNN[C]//2018 IEEE SmartWorld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computing, Scalable Computing & Communications, Cloud & Big Data Computing, Internet of People and Smart City Innovation. IEEE, 2018: 1408-1413. [百度学术] 

17

Li N, Hu L, Deng Z L, et al. Research on GRU neural network satellite traffic prediction based on transfer learning[J]. Wireless Personal Communications, 2021, 118(1): 815-827. [百度学术] 

18

Zhang Y, Zhang Y, Haghani A. A hybrid short-term traffic flow forecasting method based on spectral analysis and statistical volatility model[J]. Transportation Research Part C: Emerging Technologies, 2014, 43: 65-78. [百度学术] 

19

Deshpande M, Bajaj P R. Performance analysis of support vector machine for traffic flow prediction[C]//2016 International Conference on Global Trends in Signal Processing, Information Computing and Communication (ICGTSPICC). IEEE, 2016: 126-129. [百度学术] 

20

Dong X, Lei T, Jin S, et al. Short-term traffic flow prediction based on XGBoost[C]//2018 IEEE 7th Data Driven Control and Learning Systems Conference (DDCLS). IEEE, 2018: 854-859. [百度学术] 

21

王博文,王景升,王统一,.基于长短时记忆网络的Encoder-Decoder多步交通流预测模型[J].重庆大学学报,2021,44(11):71-80. [百度学术] 

Wang B W, Wang J S, Wang T Y, et al. Encoder-Decoder multi-step traffic flow prediction model based on long short-time memory network[J/OL]. Journal of Chongqing University,2021,44(11):71-80. (in Chinese) [百度学术]