基于Bagging Holt Winters模型的航空运输需求预测外文翻译资料
2022-08-08 19:39:28
英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
基于Bagging Holt Winters模型的航空运输需求预测
摘要
本文扩展了Bootstrap聚合方法(简称Bagging)和Holt Winters方法在航空运输业中的应用领域。在各种文献中,这种新颖的方法能更准确地进行需求预测。该方法将时间序列分解为三个附加部分:趋势,季节和余数。新的时间序列通过对剩余部分重新采样并添加趋势和季节趋势生成。Holt Winters方法用于对每个时间序列进行建模,并通过汇总预测获得最终预测。我们用来自14个国家/地区的数据系列对该方法进行了测试,并使用对称平均绝对百分比误差(sMAPE)将结果与五个方法(SARIMA,Holt Winters,ETS,Bagged.BLD.MBB.ETS和Seasonal Naive)进行了比较。结果表明用Bagging Holt Winters方法预测的结果更准确。
1.简介
2014年是Percival Fansler运营的世界上第一家往返圣彼得堡-坦帕之间的航空公司成立一百年。从那时起,航空运输业务得到了极大的发展,极大地改善了人们的出行并促进了经济发展。的确,航空运输部门是一个国家经济和社会发展的驱动力(Singh等人,2016)。这些数字是富有表现力的。根据国际航空运输协会(IATA)的数据,航空业平均每年运载30亿人和5000万吨货物,提供5660万个就业机会和2.2万亿美元的经济活动(IATA,2014年)。
尽管航空运输需求与经济发展之间的关系是共识,但因果关系的方向并非如格林(Green)(2007)所讨论的那样简单。文献表明,该关系根据上下文可以是单向的或双向的。实际上,所研究区域的空间、经济、文化和社会特征可能会得出不同的结果,因为这些因素会引发不同的出行动机。对于计划者,投资者和政策制定者而言,了解事实至关重要。Hakim和Merkert(2016)和Baker等受邀对此主题进行详细讨论(2015)。
航空运输业务的增长带来了复杂的投资和管理决策问题。如今,航空运输业的绩效是主要基于运筹学理论(OR)的复杂现代优化技术应用的结果。Barnhart等(2003)发表了有关OR技术在航空运输业中的应用的概述,包括飞机和机组人员的调度、收入管理、超额预订、基于腿的座椅库存管理以及航空基础设施的计划和运营。关于基础设施,有大量关于机场位置的文献,还有几篇关于机场选址的文章,例如枢纽位置(有关该主题的评论,请参见Farahani等,2013)。在大多数过程已经采用优化方法的环境中,更准确实际的输入数据可能会为研究人员带来竞争优势。因此,尽管预测建模具有内在的不确定性,但它仍然发挥着至关重要的作用。
根据Marazzo等人的说法(2010),需求预测是达到有效航空运输系统的基础。使用错误的预测的后果是系统拥挤、基础设施容量过大、运营商成本增加、公共和私人资金流失等等。鉴于航空运输市场的不稳定性,预测模型将扮演更加重要的角色。这会导致航空运输管制放松、新月竞争(Graham,1999)以及机场现在被视为商业企业而非公共服务组织(Singh等,2016)的事实。
在这项工作中,我们的目标是针对空中乘客需求提前一年(短期至中期)进行预测。为此,我们使用了航空运输中从未提及的方法。总体思路是将航空运输需求的时间序列分解为关键部分,模拟新的序列,对每个序列进行预测,然后将所有预测平均化为一个输出。具体来说,该方法结合了Bootstrap聚合方法(Bagging)和指数平滑方法,并且在少量修改的基础上遵循了Bergmeir等人(2016)最近提出的方法。
在第2章中,我们简要回顾了有关航空运输预测的文献。第3章详细介绍了预测方法。第4章专门介绍研究中使用的数据和评估指标。第5章展示结果。 最后一章提出了有关该主题的未来研究的结论和建议。
2.文献综述
根据不同因素对预测模型进行分类。为了解决本文提出的问题,文献综述部分着重于两个分类因素:时间范围和方法路径。另外,针对不同的要素和规模执行预测:对于单个航线,即在给定的一对始发和目的地机场之间;单个机场,说明根据设施进行的所有移动,或者国家或国际规模的一组机场。综述中分别确定了每个作者使用的元素或量表。
根据计划问题的类型,可以在不同的时间范围内进行预测。中长期预测以机场基础设施规划(航站楼容量,跑道利用和扩建决策)、空中航行服务、机队订购和设计为主要输入。Singh等(2016)对印度的长期需求进行了预测,以评估在接下来的20年中扩大印度机场容量所需的投资。Suryani等(2010)注重可用于基础设施规划的长期预测模型,即:跑道和终端容量的扩展。
短期预测为日常运营管理决策提供了关键输入,包括飞机调度、机组人员调度、拥堵延误的发生、维护计划、收入管理、广告和销售活动等。 Scarpel(2013)以位于巴西圣保罗国际机场的每月国内乘客数量建立了一个短期预测模型。Xie等 (2014)侧重于航空旅客的短期预测。Scarpel(2014)开发了短期和长期预测模型,这对航空决策者分别缓解拥堵延误事件和优化基础设施规划非常有用。
关于预测方法,已经考虑了几种方法来预测航空运输需求。在最常用的方法中,值得强调的是三种:因果计量经济学,时间序列和人工智能。计量经济学方法旨在确定与需求相关的因素(例如,总航空乘客)与社会、经济和服务相关的因素之间的关系。时间序列方法依靠历史数据序列,利用当前和过去观测值之间的相关性来生成预测。人工智能方法是计算密集型技术,试图学习和重现并非总是显而易见的模式以进行预测。
关于时间序列方法,Grubb和Mason(2001)提出了Holt Winters方法的改进版本,称为Holt Winters,具有衰减趋势。作者考虑了英国机场总乘客每月时间序列,以证明他们的方法改善了长期预测性能。他们方法的一个有趣的特征是,通过改变未来趋势,它可以生成低、中、高三种情景。Chin和Tay(2001)开发了另一个预测应用程序,使用经过调整的马尔可夫模型来预测亚洲航空公司的生存可能性。该模型考虑了航空公司增长与盈利能力之间的关系。预测模型也已用于评估官方预测。Samagaio和Wolters(2010)使用自回归和指数平滑方法对里斯本机场的乘客总数进行了独立预测。与政府的预测相比,他们得出的结论是官方的预测过于乐观。
关于因果模型和计量经济学模型,Njegovan(2005)使用诸如宏观经济变量之类的领先指标作为Probit模型的输入,以预测往返英国的空中商务旅行需求的短期变化。与基准线性模型相比,他的方法所产生的预测显示更为精确。关于敏感事件,Lai和Lu(2005)分析了911事件对美国航空旅行需求的影响。作者开发了一种干预模型,以表明在1个月内对国内需求和2个月内对国际需求都有重大影响。该模型还用于做出预测,然后与ARIMA模型生成的预测进行比较。证明了干预模型的优越性。以美国为例,Carson等(2011)就使用国家汇总数据来预测航空旅行需求还是汇总单个机场的最终预测结果,哪种方法更优进行了分析。
关于人工智能方法,Alekseev和Seixas(2009)再次使用人工神经网络开发了一种多元混合方法来预测巴西的航空运输需求,并表明他们的方法优于计量经济学方法。特别是关于城市对,Kotegawa等人(2010)考虑了人工神经网络模型和逻辑回归算法,以预测未来通过航空路线连接的未连接城市对的可能性。 Grosche等(2007)解决了使用引力模型预测已经连接的城市对之间的航空客运量的问题。最近,Xiao等人(2014)提出了一种方法的组合。作者全力开发基于奇异光谱分析的神经模糊方法。这项研究使用了来自香港国际机场的数据,表明与ARIMA、多层感知器、小波神经网络、Takagi-Sugeno-Kang递归模糊系统、经典分解和奇异光谱分析方法等模型相比,该方法预测效果更好。
据我们所知,各类文献均没有采用Bootstrap聚合(Bagging)和时间序列预测方法相结合的方法来预测航空运输需求。我们认为,这一差距值得追寻,因为这种联合方法的结果在其他领域很有成果。参见Zontul等(2013)、Hillebrand和Medeiros(2010)。因此,第3章描述了我们提出的方法。
3.方法
Bootstrap聚合(Bagging)是Breiman(1996)提出的一种著名的机器学习技术,目的是使用Bootstrap生成预测器的多个版本,然后使用它们来汇总的预测器。尽管在机器学习领域取得了不错的成绩,但只有少数几篇论文使用Bagging来提高时间序列预测的准确性。在这些论文中,学者们已经证明了这种组合可大大提高预测准确性。
由于Bagging和时间序列的结合使用了以前选择的方法,因此采用Bagging和时间序列的方法因作者而异。基于Bagging和指数平滑,目前仅开发了两种方法:Cordeiro和Neves(2009)以及最近由Bergmeir等(20016)创建的。后者提供了一种使用时间序列执行Bagging的新方法,该方法可以比前者更好,更稳定地进行预测。 Bergmeir等(2016)测试了他们在M3竞赛中的时间序列方法,该方法在许多领域(例如,宏观经济学、人口统计学、行业等)具有3003个时间序列,并且是评估和比较时间序列预测方法的主要数据集(Makridakis和Hibon,2000)。作者的成绩令人印象深刻,因为考虑到每月的时间序列,他们的方法能够击败所有其他参赛者。这使我们相信,某些行业可能会从同一方法中受益。
接下来,我们简要描述按时间序列执行Bagging的一般方法。我们还将提供有关本文结合的方法的具体细节。我们的方法与Bergmeir等(2016)的工作一致。该方法被称为Bagging Holt Winters,因为它结合了Bootstrap聚合和Holt Winters。该方法包括以下4个步骤:
3.1步骤1 :分解minus;将时间序列分解为三个部分:季节、趋势和余数
分解时间序列的方法有几种。在这项工作中,采用了基于Loess的季节性趋势分解(STL分解)。该方法的主要思想是基于“本地加权回归-Loess”应用一系列平滑操作(有关详细信息,请参阅Cleveland等,1990)。根据Hyndman和Athanasopoulos(2013)的观点,该方法具有一些有趣的特征,例如不仅可以随时间改变季节性成分,而且可以控制变化率和趋势周期成分的平滑度。
3.2步骤2 :模拟-生成其余部分的100个新版本;将季节和趋势成分添加到其余100个新版本中的每个版本中
使用Bootstrap生成其余组件的新版本(有关详细信息,请参阅Efron,1979)。应用Bootstrap时,重要的是要考虑到剩余组件仍可以串行关联。当发生这种情况时,经典过程是通过将数据分成多个块并对块进行重新采样来维护数据的依赖关系结构。有几种方法可以应用于此。在最常见的例子中,我们可以引用不重叠块引导程序(Carlstein,1986)、圆形块引导程序、固定块引导程序(Politis和Romano,1992; Politis和Romano,1994)以及在这项工作中使用的方法,移动块引导程序-MBB(Kunsch,1989)。
3.3步骤3 :预测-应用预测方法来生成100个时间序列的预测
尽管有许多预测方法可用于执行预测(例如SARIMA,神经网络等),但由于在该系列中检测到强烈的季节性模式,因此使用了Holt Winters方法(Holt,1957; Winters,1960)。该方法属于一类指数平滑方法,旨在捕获时间序列的行为,将其按趋势、季节和误差项进行分离。Hyndman等(2002)使用状态空间框架来证明该方法具有扎实的理论背景。
Holt Winters Additive方法可以定义如下:
lt=alpha;(yt-St-m) (1-alpha;)(lt-1 bt-1) (1)
bt=beta;(lt-lt-1) (1-beta;)bt-1 (2)
St=gamma;(yt-lt-1-bt-1) (1-gamma;)St-m (3)
Yt h=lt hbt St-m h (4)
Holt Winters乘法方法可以定义如下:
lt=alpha;(yt/St-m) (1-alpha;)(lt-1 bt-1) (5)
bt=beta;(lt-lt-1) (1-beta;)bt-1 (6)
St=gamma;[yt/(lt-1-bt-1)] (1-gamma;)St-m (7)
Y<sub
剩余内容已隐藏,支付完成后下载完整资料</sub
资料编号:[240322],资料为PDF文档或Word文档,PDF文档可免费转换为Word