基于经验模态分解和神经网络预测短期地铁客流量外文翻译资料
2021-12-20 21:57:05
英语原文共 15 页
基于经验模态分解和神经网络预测短期地铁客流量
Yu Wei, Mu-Chen Chen uArr;
Institute of Traffic and Transportation, National Chiao Tung University, 4F, No. 118, Section 1, Chung-Hsiao W. Road, Taipei 100, Taiwan, ROC
摘要:短期客流预测是交通系统的重要组成部分。预测结果可有效支持运输系统管理,如列车运营计划和车站客流监管计划。在本文中,提出了一种混合EMD-BPN预测方法,该方法结合了经验模式分解(EMD)和反向传播神经网络(BPN)来预测地铁系统中的短期客流。EMD-BPN模型预测分为三个阶段。第一阶段(END阶段)将短期客流序列数据分解为多个固有模式函数(IMF)分量。第二阶段(组件识别阶段)识别有意义的IMF作为为BPN的输入变量。第三阶段(BPN阶段)应用BPN模型来进行客流预测。历史乘客流量数据,提取的EMD分量和时间因素(即,星期几,一天的不同时间段,以及工作日或周末)都作为第三阶段的输入变量。实验结果表明,本文所提出的混合EMD-BPN模型方法在预测短期地铁客流方面表现良好且稳定。
1介绍
短期客流预测是交通系统的重要组成部分,可用于引导出行行为,减少乘客拥堵,提高交通系统的服务质量。短期客流预测结果也可用于支持运营系统管理,如列车运营计划,车站客流监管计划等。
短期交通预测(Smith等,2002; Vlahogianni等,2004)和短期客流预测(Tsai等,2009)是文献中短期交通预测的成功应用。短期运输预测方法通常可分为两类:含参数和不含参数(Smith等,2002; Vlahogianni等,2004)。含参数和不含参数的差别是函数依赖于独立变量或非独立变量。
在传统的含参处理方法中,历史平均法(Smith和Demetsky,1997),滑动预测法(Williams等,1998)和自回归综合移动平均(ARIMA)(Hansen等,1999; Lee和Fambro,1999) 已应用于预测运输需求。特别是,自20世纪70年代以来,ARIMA已成为常见的参数预测方法之一。
对于不含参数的处理方法中,已经使用了几种方法来预测运输需求,例如神经网络模型(Dougherty,1995; Vlahogianni等,2004),非参数回归模型(Smith等,2002; Clark,2003)。,卡尔曼滤波模型(Wang和Papageorgiou,2007)和高斯最大似然模型(Tang等,2003)等。在这些不含参数方法中,神经网络模型经常被用作建模方法,因为它们具有适应性,非线性和任意函数映射能力的特征(Zhang等,1998)。
2方法
2.1经验模态分解
经验模式分解(EMD)可以处理非线性和非平稳数据。EMD主要依据数据自身具有的时间特征将时间序列数据分解为一定数量的振荡模块。每个振荡模块类似于调和函数,并且能用固有模式函数(IMF)表达。而被选用的IMF必须满足以下两个条件(Huang等,1998):
- 在信号的整个数据集中,极值的数量和零交叉的数量必须相等或不同,两种状态只能存在一种;
- 在任何时候,由局部极大值和由局部最小值定义的包络值的平均值是零。
EMD的本质是从原始数据中筛选出IMF或基本模式分量。EMD算法描述如下(Huang 等,1998)
步骤1:从时间序列x(t)中识别所有局部极值,包括极小值和极大值;
步骤2:通过三次样条线生成上下包络线和;
步骤3:计算和的平均值,然后生成平均包络线,
其中:
步骤4:计算时间序列数据x(t)和平均值之间的差值。第一个差异被设计
为原始固有模式函数:
步骤5:检查原有固有模态函数是否满足IMF的性能。理想情况下,应该是
IMF。然而,在筛选时可能会产生一个新的极值,最终起到消弱或增强原有极值的效果。如果的性能满足IMF的所有要求,则定义为第i个IMF,即 ,并且代替原有时间序列数据的函数为:
如果,的性能不能满足IMF的要求。不能作为IMF,则将被用来代替原有时间序列。
步骤6:重复步骤1-5直到差值能满足最终的判定规则,筛选过程停止。首先,差值或第i分量小于预定阈值或变为单调函数,使得不再能够提取IMF。其次,零交叉和极值的数量与连续筛选步骤的数量相同(Huang等,2003b)。
通过使用上述算法,原始时间序列数据可以分解为n个模型单元,最终得到如下式:
其中n是IMF的数量,集合表示彼此正交并有周期性的IMF集合,并且是最
后一个差值,或者是一个常数或是一个极值。通过筛选过程,每个IMF在表达原始时间序列数据的局部特征时是独立且唯一的。IMF的集合可以通过高频或低频导出。此外,EMD还可以作为一个高通,带通或低通的滤波器。
2.2神经网络
多层感知器神经网络(MLP)是最流行的神经网络模型之一。它具有复杂的匹配数据的能力,可以使输入变量和输出变量的对应关系有着非线性函数的特性(Zhang 等,1998; Balestrassi 等,2009)。MLP模型的体系结构由多个层组成,包括输入层,一个或多个隐藏层和输出层。 每层都包括一定量的与其他相邻层相联系的神经元。由于MLP在多个层中包含许多非线性相互作用的神经元,因此它可以反映出复杂的现象。
2.3EMD-BPN组合模型
在本文中,提出的短期客流预测混合方法,即EMD-BPN。 在EMD-BPN中,有三个阶段,利用EMD进行数据分解,EMD分量识别和预测。 图1说明了混合EMD-BPN方法。这三个阶段具体情况如下:
2.3.1阶段1:EMD阶段
第一阶段(EMD阶段)将原始客流序列数据分解为多个IMF分量,并且还起到数据过滤的作用。提取的IMF分量可以表示从高到低的一系列频率的分布,并且反映客流的各种周期性特性。每个IMF分量可以表示自身局部特性的时间尺度。BPN的计算要求随着输入节点的数量而增加到极端程度。因此,在保持预测准确性的同时,识别BPN的输入数据对于降低计算要求至关重要(Zheng 等.2004)。
2.3.2阶段2:分量识别阶段
第二阶段侧重于识别有意义的IMF分量作为BPN模型的输入。 提取出来的IMF分量代表从高到低的一定范围的频率。 高频IMF分量表示短时间的部分,低频IMF表示长时间的部分。 尽管MLP主流解法和训练算法已经能够处理大量输入数据,但是低相关性的输入值(例如,长时间的IMF)会导致运算维度和时间的增加。因此,为了建立适当的短期预测模型,有必要确定有意义的IMF分量。
2.3.3阶段3:BPN阶段
优化输入特征(属性或变量)选择对于每个预测模型都是最重要的问题。许多研究人员已经研究了特征选择问题,并提出了各种方法。通常,特征选择方法可以分为两大类:过滤算法(Blum和Langley,1997)和包裹算法(Kohavi和John,1997)。过滤方法使用预处理步骤选择一个特征子集。该方法基于学习算法和相关性特征将数据集划分为相关和不相关的特征两种。包裹算法使用归纳算法本身作为评估函数的一部分,从可能的特征子集空间中选择最佳特征子集(Kohavi和John,1997)。虽然第二种方法可以获得最优特征子集,但由于计算时间和空间的复杂性,它不易使用。然而,本文在混合EMD-BPN模型的使用中建立了一个系统性的设计指南,该方法考虑了高相关性的IMF分量和低相关性的IMF分量(即,与原始数据有相关的IMF分量和不具有相关的性IMF分量)。因此,EMD-BPN混合模型既不是过滤算法也不是包裹算法。
3实验设置
3.1数据
通过收集快速交通的客流数据集来研究本文提出的EMD-BPN算法在预测短期客流方
面的可行性。该数据集是2008年5月1日至5月31日期间台北捷运公司(STTC).Muzha 线,Muzha线是一个中等容量的运输系统。在为期4周的数据收集期间,有一个公共假期(即5月1日国际劳动节)。预测结果可能不会受到这个公众假期的影响,因为大多数人在5月1日仍在上班。通过自动售票系统共收集了2325个观测值,间隔为15分钟。考虑到TRTC的运营时间,每天数据收集的时间从当天的上午6:00到第二天00:45。
3.2IMF分量的提取
在第一阶段(EMD阶段),通过使用EMD算法将客流时间序列数据分解为九个IMF分量(IMF C1,IMF C2,...和IMF C9)和一个剩余量(IMF C10),如图 2所示(Chen和Wei,2011)。所有提取的IMF分量以它们被提取的顺序通过图形方式显示出来,也可以显示从最高频率到最低频率的频率(或周期)的顺序。首先,高频(或短周期)分量被包含在前几个IMF分量中(例如,IMF C1),同时低频(或长周期)分量被包含在最后几个分量中(例如,IMF C6-C9)。前几个分量代表原始客流数据中的高时间变量或噪声,而最后几个分量代表长周期分量。最后分量是经过筛选后的残留部分,通常代表时间序列的趋势。 在本文中,EMD分量是通过视觉信号 1.2获得的。
3.3IMF分量的识别
在第二阶段(分量识别阶段),为了探讨提取的IMF分量的物理现象,应用皮尔逊相关性分析和肯得尔等级相关分析两种方法对IMF分量和原始时间序列数据的相关性进行计算
3.4预测模型的设计
在第三阶段(BPN阶段),在执行预测模型之前,收集的数据被分成两个独立的数据集,即训练数据集和测试数据集。训练数据集包含从5月1日到5月24日的1800个客流数据点,占原始数据的77%,测试数据集包含5月25日至5月31日的525个客流数据点,占原始数据的23%。训练数据集导入预测模型,用来训练神经元间的权重和阈值。测试数据集用于验证预测模型的有效性。使用这两个数据集,输入变量的数量基于滚动范围,输出变量的数量基于预测范围。 这些数据在输入BPN之前将被标准化。在本文中,BPN使用NeuralShell 2软件来运行。
3.4.1输入层
输入层的元素包括乘客流量数据,乘客模式(即IMF分量)和时间因素。乘客模式
包括有意义的分量(IMF C2-C5)和关于输入特征识别的其他分量(IMF C1,C6-C10)。有意义的分量可以作为单个或聚合形式的输入变量,因为它们与原始数据有明显的相关性。通过考虑输入矢量的维数和计算要求,也可以将原始数据中可能是噪声的其他分量视为单个或聚合形式的输入。
3.4.2隐藏层
激活函数,学习速率,动量和初始权重设置与输入层的相同。隐藏神经元的数量与
NeuroShell 2软件中的默认值有关的。
3.4.3输出层
输出神经元的数量取决于预测步骤和预测范围。如上所述,可以针对一个或多个步
骤执行预测。在本文中,使用预测最多提前四个预测步骤,即预测范围最多为60分钟。因此,输出神经元的数量从1到4。
3.5性能检测
已有的研究献中已使用若干性能指标来研究时间序列预测模型的可行性。两个广泛使
用的性能指标,即平均绝对百分误差(MAPE)和绝对百分比误差方差(VAPE),并且已有研究对比过两者的同异(例如,Balestrassi等,2009; Zhang和Ye,2008)。MAPE测量平均预测准确度,VAPE反映预测稳定性。
4 结果和分析
4.1时间因素的作用
为了研究时间因素对预测结果的影响,本文提出了四种基于BPN的模型,即BPN-TF0,BPN-TF1,BPN-TF2和BPN-TF3,以验证时间因素的重要性(即,一周内某一天,一天的某个时间段,工作日或周末)。
4.2组合模型的实验结果
上面设计的四种混合预测模型,即EMD-BPN1,EMD-BPN2,EMD-BPN3和EMD-BPN4,用于研究混合EMD-BPN方法的有效性。 这四种混合模型主要在选择的IMF分量中有所不同,这些模型总结在表2中。
考虑到这些预测模型的训练时间,以预测步为1为例,BPN-TF3的平均训练时间约为33分钟,而EMD-BPN1,EMD-BPN2,EMD-BPN3的平均训练时间和EMD-BPN4分别为33,57,61和38分钟。也就是说,BPN-TF3和EMD-BPN1的训练时间较短。 EMD-BPN4的训练时间相对较短,因为IMF C2-C5和IMF(C1,C6-C10)分别作为短期预测模型的输入进行汇总。 IMF分量的聚合降低了EMD-BPN4的输入变量的维数。另外,EMD的计算时间相对较短(在10秒内)。 CPU时间基于IBM兼容PC,Intel Co
资料编号:[4226]