大数据交通流预测:一种深度学习方法外文翻译资料
2022-09-06 11:43:47
英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料
大数据交通流预测:一种深度学习方法
摘要
准确及时的交通信息是智能交通系统的成功部署的关键。在过去的几年中,交通数据已经爆炸,我们已经真正进入了大数据的时代的交通运输。现有的交通流预测方法主要采用浅交通预测模型还有许多在现实生活中的应用是不令人满意的。这种情况激励我们重新思考基于大数据的深层次模型交通流问题。在本文中,提出了一种新的基于深度学习的交通流预测方法,它考虑了时间和空间固有的相关性。堆叠的自编码模型被用来学习通用的交通流的特点,它被用一种贪婪的分层的方式来训练。据我们所知,这是第一次将一个深层的架构模型应用于自动编码器作为构建块来表示交通流特征预测。此外,实验表明,所提出的交通流预测方法的具有优越的性能。
关键字:深入学习,堆叠自动编码器(SAE),交通流量预测
一 介绍
准确和及时的交通流信息目前是,个别旅客,业务部门和政府机构所强烈需要的。它有助于道路使用者做出更好的出行决策,缓解交通拥堵,减少碳排放,提高交通运行效率。交通流预测的目的是提供这样的交通流信息。随着智能交通系统的快速开发和部署(ITSS)交通流预测得到越来越多的关注。它被视为成功部署其子系统,特别是先进的旅客信息系统,先进的交通管理系统,先进的公共交通系统,商用交通运作中的关键因素。
交通流预测在很大程度上依赖于来自不同的传感器中的历史和实时交通数据的收集,包括感应回路,雷达,摄像机,移动全球定位系统,人群采购,社会媒体等与广泛的传统交通传感器和新兴的交通传感器技术,交通数据正在爆炸,我们已经进入了大数据传输时代。运输管理和控制现在正变得越来越依靠数据驱动,虽然已经有了很多的交通流量预测系统和模型,但他们大多使用浅流量模型,在某种程度上还是不太令人满意。这激发了我们基于深度架构模型用这样的丰富的流量数据来重新思考的交通流预测的问题。
最近,深度学习,一种机器学习方法,已经引起了很多学术界和工业界的兴趣。它已被成功地应用于分类任务,自然语言处理,降维,物体检测,运动建模等。深度学习算法采用多层次的体系结构或深层结构,从最低层到最高级别的数据中提取固有的特征,并且它们可以发现在数据中大量的结构。由于交通流过程是复杂的,深度学习算法可以表示没有先验知识的交通功能,这交通流预测有很好的性能。
在本文中,我们提出了一种基于深度学习的交通流预测方法。在这里,一个堆叠的自编码(SAE)模型是用来学习通用的交通流的特点,它是以一个分层的贪婪的形式训练。作者认为,这是首次将SAE的方法被用来表示交通流特征的预测。在模型中,是空间和时间是被认为有着固有的相关性。此外,它论证了所提出的交通流预测方法具有优越的性能。
本文余下的组织如下。第二章回顾了短期交通流预测的研究。第三章提出自动化模块作为交通流预测的积木的深层学习方式。第四章讨论了实验结果。结语部分是在第五章中描述的。
二 文献综述
交通流预测一直以来被认为是智能交通系统的关键功能。在过去的几十年中,为了协助交通管理和控制,提高从路线指南和车辆路径到信号协调中的运输效率,开发了大量的交通流预测模型。交通流的演化可以看作是一个时间和空间的过程。交通流预测问题可以表述如下:表示在一个交通网络的i 观察位置的t时间段内的交通流数量。给定被观察的交通流数据的一个数列,i=1,2,hellip;,m, t=1,2,hellip;,T, 问题是要在一定预测范围内去立即预测每个时间间隔(t )中的交通流。
早在20世纪70年代,自回归移动平均(ARIMA)模型就被用来预测短期高速公路上的交通流[10]。自那时起,学者们连续不断地提出适用于不同领域的交通流预测模型,有交通运输工程、统计、机器学习、控制工程和经济。之前的预测方法能被分成三类,分别是参数化技术、非参数化方法和模拟。参数化模型包括时间序列模型、卡尔曼滤波模型等。非参数化模型包括K-近邻(K-NN)方法、人工神经网络(ANN)等。模拟方法利用交通模拟工具以预测交通流。
被广泛运用于交通流预测问题的技术基于时间序列方法。Levin和Tsao采用了Box-Jenkins的时间序列分析来预测高速公路的交通流,发现了ARIMA(0,1,1)模型在统计上对所有的预测都是最重要的[11]。Hamed等人采用了一种ARIMA模型来预测城市干道上的交通量[12]。为了提高预测精度,提出了许多ARIMA的变形,例如KARIMA[13]、子集ARIMA[14]、ARIMAX[15]、ARMA、时间序列ARIMA[16]和SARIMA[17]。除了ARIMA时间序列模型,其他类型的时间序列模型也被用来预测交通流。
由于交通流的随机和非线性特性,研究者们更加关注在交通流预测领域的非参数化方法。Davis和Nihan在短时间高速公路交通预测上使用了K-NN方法,辩解K-NN方法与线性时间序列方法表现相同,并不比它更好[19]。Chang等人基于K-NN非参数化回归模型,呈现了一个动态的多元间隔交通流预测模型[20]。EI Faouzi 为回归函数开发了核平滑,以进行短期交通流预测,并在预测中运用了功能性评估技术[21]。Sun等人使用了一个局部线性回归模型来进行短期交通预测[22]。在[23]中提出了用于交通流预测的叶贝斯定理网络方法。[24]提出了用于短期交通流预测的在线学习的加权支持向量回归(SVR)。[25]-[34]发展了不同的ANN模型以预测交通流。
为了获得自适应模型,一些研究联合不同的技术来探究混合方法。Tan等人基于移动平均数(MA)、指数平滑(ES)、ARIMA和神经网络,提出了一种用于交通流预测的集成方法。在集成阶段,利用MA、ES和ARIMA模型获得3组作为NN基础的相关时间序列[35]。Zargari等人开发了不同线性遗传编程、多层感知器和模糊逻辑(FL)模型来预测5分钟和30分钟的交通流率[36]。Cetin和Coment将ARIMA模型与期望值—最大化和累积和计算程序相结合[37]。一个自适应的混合模糊规则系统方法被提出来用于城市交通流建模与预测[38]。
除了以上被提到的方法外,卡尔曼滤波方法[39][40]、随机微分方程[41]、在线基于变点模型[42]、type-2FL方法[43]、变动无限混合模型[44]、模拟[45]和动态交通分配[46][47]也被用来预测短期交通流。
文献已经提出了交通流预测模型的对比研究。线性回归、历史平均水平、ARIMA和SARIMA在[48]中被评估,其中它总结出这些运算在正常工作状态下能很好地和合理地运行,但对外界系统变化不能很好地响应。SARIMA模型和非参数化回归预测模型在[49]中得到评估。结果发现,所提出的启发式预测生成方法改进了非参数化回归的性能,但是它们仍比不上SARIMA模型。[50]对多变量状态空间模型和ARIMA模型进行了比较,它表示前者的性能比后者更好。Stathopoulos和Karlaftis[50]指出了不同模型规格适用于一天里的不同时间段。
Lippi等人[51]比较了SVR和SARIMA模型,并得出结论,当在最拥堵时段进行预测时,所提出的季节性支持向量回归更有竞争力。Chen等人报道了ARMA、ARIMA、SARIMA、SVR、贝叶斯定理网络、ANN、k-NN、Naiuml;ve I 和Naiuml;ve II模型在不同聚集时间尺度(分别设置为3、5、10和15分钟)的性能测试结果。有一系列的研究致力于神经网络和其他技术例如历史平均水平、ARIMA模型和SARIMA模型[53]-[55]的比较。有趣的是,我们能发现非参数化技术显然比简单的统计技术更好,例如历史平均水平和平滑技术。但是非参数化方法不管能否产生更好或者与进行比较的高级统计方法相同的结果,例如SARIMA,都存在矛盾的结果。
从[56]和[57]中能找到对短期交通流预测的详细评价。
总之,由于对智能交通系统的实时交通流信息的需求不断增长,大量的交通流预测算法已经被开发出来,且涉及不同学科的不同技术。不管如何,很难说,在任何情况下,某种方法明显比其他方法优越。这其中一个原因就是所提出的模型都是基于小量的单独特定交通数据而被开发,而且交通流预测模型的精度取决于嵌入所收集到的时空交通数据中的交通流特征。此外,一般情况下,当使用神经网络时,文献都显示了令人满意的结果,这种结果具有良好的预测能力和鲁棒性。
虽然神经网络的深层结构可以比浅型网络了解更多强大的模型,现有的基于神经网络的交通流预测通常只有一个隐层。培养出一个基于梯度训练算法的深层结构的神经网络很难。自韩丁的突破以来,深度学习的最新进展已经训练了可行的深层结构,并且这些深层学习模式在某些方面优于国家最先进的方法。在本文中,我们将探讨SAE交通流预测的深层学习的方法。
三 方法
这里引入了一个SAE模型。SAE模型是一堆自编码,这是一个著名的深度学习模式。它使用自编码如同积木一般打造了一个深层网络。
A.自编码
自编码是试图再现其输入,即目标输出是该模型的输入神经网络。图1给出了一个自编码,它具有一个输入层,一个隐藏层和一个输出层。给定一组训练样本{x(1),x(2),x(3),hellip;},其中x(i)属于Rd,自编码首先将输入值x(i)编码至一个基于(1)的隐藏表示y(x(i)),然后将y(x(i))解码重构入z(x(i))中,如(2)所示。
y(x)=f(W1x b) (1)
z(x)=g(W2y(x) c) (2)
其中,W1为权重矩阵,b是编码偏差矢量,W2是一个解码矩阵,c是一个解码偏差矢量。我们对于本文中的f(x)和g(x)考虑物流S型函数1/(1 exp(-x)).
通过最小化重构误差L(X,Z),我们可以得到模型参数,在这里表示为theta;,
(3)
涉及自编码的一个严重的问题是,如果隐藏层的大小比所述输入层相同或更大,这种方法可能学习身份功能。然而,目前的实践表明,如果非线性自编码有更多的隐藏单元比输入,或者如果有如稀疏性约束加强的其他限制,就是没有问题的。当稀疏约束被加入目标函数,代表隐藏层稀疏表示的自编码就成为了稀疏自编码。为了实现稀疏表示,我们会通过稀疏约束尽量减少重建误差,如
(4)
其中 是稀疏项目的重量, 是隐藏单元的数目, 是一个稀疏参数并且是一个极小的接近于0的值, 是隐藏单元j在训练集的平均激,并且 是库勒巴克-莱布勒(KL)散度,被定义为
KL散度的属性是如果.它提供了在线编码稀疏约束。后向传播(BP)算法可用于解决这个最优化问题。
B.SAEs
一个SAE模型通过堆叠自编码来取自编码的输出层发现更低层作为当前层的输入,以形成深层网络创建。更清楚的是,通过l层考虑SAE时,第一层被训练成一个自编码,设置为输入训练。获得第一个隐藏层后,将第k个隐藏层的输出用作第(k 1)个隐藏层的输入端。以这种方式,多个自编码可分层叠放,如图2.
要将AE网络用于交通流预测,我们需要在顶层加一个标准预测。在本文中,我们在网络顶端加了一个回归层用于监督交通流预测。SAE加上了预测器,包括交通流预测的整个深层体系结构模型,示于图3.
C.训练算法
应用梯度优化技术将神经网络应用于深层网络,是一种直接的方法。 不幸的是,我们得知用这种方式训练的深层网络有不良表现。最近,Hinton等人已经开发了一个贪婪的分层的无监督学习算法,可以成功地训练深层网络。使用贪婪的逐层监督学习算法的关键点是预先在一个自下而上的方式逐层训练深层网络层在训练阶段,微调BP可以用于调整模型参数使上下方向及出结果的时候变得更好 。该训练过程是根据[58]和[59],其中可以如下说明。
- 通过用训练集作为输入最小化目标函数训练第一层作为自编码。
- 训练第二层作为自编码以第一层输出为输入。
- 迭代(2)中层的所需数目。
- 使用最后层的输出为输入的预测层,并随机初始化其参数或受监管的培训。
- 在有监督的方法中,对所有的层的参数进行微调。
该过程总结在算法1中。
算法1 saes训练
给定的训练样本x和所需数量的隐藏层l
步骤1 sae的预训练
-设置稀疏gamma;,稀疏参数rho;的权重,随机初始化权重矩阵和偏置向量。
-贪婪逐层培训隐层。
-使用第k个隐层的输出作为第(k 1)个端口隐层的输入。 对于第一隐层,其输入是训练集。
-通过最小化目的函数为第(k 1)隐层查找编码参数{W1k 1, b1k 1}lminus;1k=0
步骤2 微调整个网络
-对 {Wl 11, bl 11}初始化随机或指导训练。
-使用BP方法与基于梯度的优化技术来改变整个网络在自顶向下的方式的参数。
四 实验
A数据说明
所提出的深架构模型应用于从加州交通局绩效测量系统(PEMS)数据库作为一个算例收集的数据。交通数据每30秒从150
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[146861],资料为PDF文档或Word文档,PDF文档可免费转换为Word