基于LSTM的交通流预测毕业论文
2020-02-17 21:59:07
摘 要
交通流预测是在当前和过去时刻的交通数据分析的基础上,建立模型对将来交通流进行预测,随着道路数量和机动车数量急剧增加,一系列交通问题相继出现,准确的交通流预测可以为规划线路和交通疏导提供决策支持,对于智能交通系统有着重要意义。道路交通流存在明显的随机性和不确定性,传统的统计预测方法和一些智能方法已经取得一定效果,但非线性拟合能力依然有限,近年来,深度学习迅速发展,在各领域广泛运用,也为交通流预测提供了新的方向,尤其是长短时记忆网络(LSTM),但其在交通流预测领域的价值仍未完全开发。
本文提出一种基于K-最近邻(K-nearest neighbor,KNN)和深度单双向长短时记忆网络(deep stacked bidirectional and unidirectional LSTM,DBU-LSTM)结合的交通流预测模型,利用KNN从一定区域路网内筛选与目标检测站相关的检测站,将其构造数据集输入DBU-LSTM网络训练预测输出,双向LSTM用于学习空间特征和前后时间依赖关系,深层结构可以逐步构建更高层次的序列数据表示。该模型同时考虑了路网交通流的时空关系,弥补了现有浅层模型的不足,利用英国高速公路网络真实交通数据进行实验,绝对误差(MAE)和平均相对误差(MAPE)都较低,预测效果良好。此外,我们还将模型与其他模型进行对比,并从多个角度分析了不同参数对模型的影响。
关键词:交通流预测;K-最近邻;深度学习;长短时记忆网络;深度堆叠
Abstract
Traffic flow prediction is based on the analysis of the current and past moment traffic data, then build a model to forecast the traffic flow in the future, as the number of the roads and motor vehicles has increased dramatically, a series of traffic problems appeared, accurate prediction of traffic flow can provide decision support for planning routes and traffic guidance, has important significance for intelligent transportation system. Road traffic flow exist obvious randomness and uncertainty, the traditional statistical forecasting methods and some intelligent methods has achieved a certain effect, but the nonlinear fitting ability is limited, in recent years, the rapid development of deep learning, has been used widely in various fields, also provides a new direction for the traffic flow prediction, especially the Long Short-Term Memory (LSTM), its value in the field of traffic flow predictive has not been fully developed.
In this paper, we build a traffic flow prediction model based on K - nearest neighbor ( KNN) algorithm and deep stacked bidirectional and unidirectional LSTM (DBU - LSTM), using KNN screen the detection stations related to the target detection stations from a certain area network and construct data set as the input of DBU-LSTM network, DBU-LSTM network does the training and forecasting work, bidirectional LSTM is good at learning spatial characteristics and before and after time dependence, deeper structures can be used to build progressively higher-level representations of sequential data. The model also considers the spatiotemporal relationship of the traffic flow in the road network and makes up for the deficiency of existing shallow model. It makes use of the real traffic data of British expressway network to carry out the experiment. Both absolute error (MAE) and average relative error (MAPE) are low and the prediction effect is good. In addition, we also compared the model with other models and analyzed the impact of different parameters on the model from multiple perspectives.
Keywords: traffic flow prediction;K-nearest neighbor; deep learning;Long Short-Term Memory;deep stack
目 录
摘 要 I
Abstract II
1 绪论 1
1.1研究背景及意义 1
1.2国内外研究现状 1
1.2.1交通流预测的分类 2
1.2.2传统统计理论模型 2
1.2.3人工神经网络模型 2
1.2.4深度学习模型 3
1.3 本文研究内容与组织结构 4
2 相关工作 6
2.1短时交通流数据分析 6
2.1.1短时交通流基本参量 6
2.1.2短时交通流主要特性 7
2.1.3短时交通流数据采集 8
2.2短时交通流数据预处理 8
2.2.1数据修正 8
2.2.2数据去噪 9
2.2.3数据归一化 10
2.3深度学习理论 11
2.3.1深度学习概述 11
2.3.2深度学习激励函数 11
2.3.3深度学习优化方法 13
2.3.4深度学习常见模型及应用 14
3 基于KNN与深度LSTM堆叠的短时交通流预测 16
3.1问题引述与研究思路 16
3.2 KNN算法 16
3.3循环神经网络 17
3.3.1RNN网络 17
3.3.2长短时记忆网络 18
3.3.3双向长短时记忆网络 20
3.4 KNN-DBU-LSTM模型 21
3.5性能评价指标 24
3.6 实例分析 24
3.6.1数据描述 24
3.6.2数据预处理 25
3.6.3运行环境与参数设置 26
3.6.4结果分析 26
4 总结与展望 31
参考文献 33
附 录 36
致 谢 37
1 绪论
1.1研究背景及意义
随着中国经济的飞速发展,各行各业的不断更新,汽车已经成为快节奏生活的必需品,汽车的种类和数量逐年增加。2017年年底统计数据表明,全国范围内机动车数目已经增长至3.1亿辆[1]。汽车提高了人们的日常出行的舒适度,带来各个方面的便利,但是也制造了非常严重的问题,加重了城市道路的负担,使得原本高负荷的城市交通阻塞问题愈发明显。同时,大量拥堵的机动车排放尾气给城市环境及空气质量带来巨大损害。
对于交通拥堵等诸多问题,政府部门采取了诸多措施,主要可分为三种:第一,增建道路、桥梁、人行通道等城市基础设施来容纳更多车辆。虽然每年投入大量资金,但依然跟不上交通量的增长速度,城市土地面积有限,各种生态植被也是十分珍贵的,从某种程度上给此方案的实施带来巨大限制。第二,从根源上减少流量,控制汽车生产数目,鼓励市民使用公共交通,或者限号驾驶。第三,从管理层面入手,采用更科学的管理方式和更完善的管理系统,对实时路况进行监控并对可能出现的拥堵状况作出即时的诱导,或者将车辆组织到适宜的道路上,从而提高交通系统运作效率,为车辆提供了安全保障。在科学技术发达的今天,完善交通管理体系是行之有效的重要手段。
智能交通系统(ITS)在此背景下诞生了,成为国内外许多城市缓解交通问题的最佳方案,目的在于为人们提供便捷、高效、环保节约的服务。道路交通系统的智能化是通过大数据分析及人工智能方法来实现的,它涵盖了信息采集、信息分析、信息发布、车辆控制、道路监控、电子收费、驾驶员管理、事故救援等多个方面[2]。其中,交通信息预测是未来智能交通系统的首要任务。如何收集、处理、分析海量数据中所体现的交通流特征,并使用智能方法和模型科学快速地预测未来交通流的走向,进而优化车辆路径,避免交通拥堵对于交通控制有着决定性的影响。
交通流预测对于个人和社会都有着积极意义,直接影响到生活的各个方面。对于国家交通运输部门,交通流量预测为其合理利用规划交通资源提供技术支持和数据支撑,避免了过多使用率低的道路建设,节省了国家资金的投入。对于企业和公众来说,准确的交通流量预测数据可以为出行路径、出行方式提供指导,及时了解路况,减少多余的行程时间和费用开支。
1.2国内外研究现状
1.2.1交通流预测的分类
从观测时间上看,短时交通流预测往往以天、小时、半小时为单位进行预测,最大时间步长一般不超过15min内,预测时间段是天、月,甚至是年则称为中长期交通流预测。智能交通系统往往需要快速作出决策,中长期预测结果建立在长期趋势的提取上,应用价值较差,只对于国家交通资源规划及长期统筹这种对精度要求不高的情况有利。而短期交通流预测常使用在对于实时性要求高的智能交通系统,短期预测可以为交通筹划提供指导,实现车辆分流,从而对交通拥堵进行缓解。
1.2.2传统统计理论模型
传统统计理论模型最早被提出,发展最成熟,可以分为线性理论模型和非线性理论模型。线性模型主要有时间序列模型和历史均值模型[3],如差分自移动平均模型(ARIMA)[4]和自回归滑动平均模型[5],其中自回归滑动平均模型实用性最强,描述交通流数据结构所需参数较少,模型阶数低,时间序列模型最大的优点是实现简单,便于计算,但在历史数据不够的情况下往往效果较差。此外,使用较多的线性模型还有卡尔曼滤波模型,1960年现代控制中重要的卡尔曼滤波理论及最优估计概念被提出,卡尔曼滤波在输入输出观察值基础上对进行系统状态进行推断,采用线性无偏均方误差衡量输出和输入之间的距离,不断迭代修正系统的权值,这种调整机制使误差达到最佳状态,对于数据的平稳性要求不高,适合交通流处理。传统卡尔曼滤波预测一般在维持方差不变的前提下进行,但性能在交通量波动幅度大时会显著降低。Guo 等[6]人为改善交通不稳定状态下的预测不足,提出了一种自适应卡尔曼滤波算法,研究表明在预测区间能够产生更精确的结果。当数据流随机性稍强时,线性方法抗干扰能力差,多种非线性预测模型被提出,使用较多的有非参数回归模型[7]、马尔科夫模型[8]等,非参数回归方法对数据分布没有严格规定,稳健性较高,有较好的误差分布通过搜索相似的历史记录估计未来状态,可以应对出现多种突发事件的数据流,但搜索时需要足量的历史观测数据,复杂性高,计算代价大。马尔科夫模型一般用于过程的状态预测,但对转移概率有严格要求,矩阵参数调整较复杂,不适合长期预测。
1.2.3人工神经网络模型
人工神经网络模型就是模拟人脑大量神经元互联进行繁杂问题处理的方式,对其进行抽象,把信息在人脑神经系统中的处理加工系统转换为数学模型,前后级不存在反馈的称为前向网络,如单层感知器、BP神经网络和RBF神经网络等,前后级存在反馈称为反馈网络,如HNN、BSB等。
神经网络有着良好的学习能力和联想存储能力,在对系统内部知之甚少的情况下,依然可以进行非线性拟合,同时高度并行处理使寻优速度大大提高,使得其成为多年来的研究热点[9]。Song等提出了一种自适应突变算子来改进的粒子群优化算法,并将其引入神经网络[10]。Yang用聚类搜索改进了传统小波神经网络,收敛速度更快,预测精度更高 [11]。Feng通过RBF网络进行交通流量预测,同时结合粒子群算法,模型适应性强,运行效率高[12]。Niu等将GRNN用于预测海上船舶流量,研究了果蝇算法与GRNN的融合,提高了其计算速度,泛化能力明显提高[13]。Chan等先筛选出与未来流量强相关的道路,然后将其输入模糊神经网络,预测结果改善了流量数据的利用率,鲁棒性好[14]。于亚男在神经网络基础上动态修改学习率进行参数选择,提出利用遗传算法优化的GA-BBP算法[15]。Dong分析了交通网络数据,利用Elman良好的记忆能力预测网络流量,有着更高的精度和推广价值[16]。
神经网络有着诸多优点,但其弊端也不可忽视,将所有问题和特征都转变为数值计算,易丢失重要信息,当权重和参数设置不当时,可能会出现过拟合现象,这时往往无法达到预期效果,同时神经网络相比传统方法需要更多的训练样本,过于依赖数据,这也是其使用的局限。
1.2.4深度学习模型
人工智能经过数十年已经发展成计算机科学研究中的重要部分,1950年左右,科学家试图赋予计算机人类的逻辑推理和智能思维,接着人工智能的概念被提出,其目的是模拟人脑完成复杂任务,甚至超越人脑能力。机器学习作为一个综合微积分、统计学、逼近论和计算复杂度等多门学科的领域,在人工智能中占有核心地位。机器学习的核心理念是设计使计算机可以模拟或具备人类行为的算法,自动学习技能,进而不断调整、改进和优化自身体系,已在多个领域广泛应用,而具有多层次网络、能够捕捉数据中的深层联系的深度学习又是机器学习中更为先进的技术,目前广受国内外学者的关注。
深度学习建立了阶层结构的ANN,核心是深度。2006年,多伦多大学教授Hinton[17] 针对深度信念网络提出两个全新的观点,一是深度神经网络可通过表示的无监督的逐层(预)训练,加上一个产生预测的有监督附属层,使网络训练更容易达到最优;二是神经网络模型中隐藏层数量的增加可以使网络对数据本质和特征表达具有更优的学习能力,在此之后,深度学习遭到火热追捧,被应用在语音识别、网络搜索、推荐系统、视频处理等多个领域,作为一门新兴技术,也渐渐凸显出在交通流预测领域的优势,许多学者通过深度学习方法都取得不错的结果。
Huang 等对深度信念网络(DBN)进行无监督训练,将多任务回归集成到顶部,并充分利用权值共享,预测误差降低5% ,有着广阔前景[18]。Ma 等充分利用长短时记忆神经网络(LSTM)较强的时间序列预测能力,准确性的与其他模型相比明显提高,验证了其有效性[19]。Jia 等进一步考虑降雨因素,使用 DBN 和LSTM混合模型进行预测,预测精度要比无降雨因子时高 [20]。江德浩考虑了道路数据中的随机噪声,先进行小波降噪,之后输入DBN,预测性能更好[21]。Kuremoto[22]在波尔兹曼机中加入DBN,实验表明该算法在交通运输研究中有良好的发展前景。焦琴琴等使用深度信念网络与支持向量回归顶层连接的方式达到比传统模型更好的预测精度[23]。Yisheng Lv等首次提出自动编码器构建块来表示预测的交通流特性的深度架构模型,并充分考虑交通流的时空性,有着较好的预测性能[24]。
深度学习目前正迅速发展并取得许多成果,将人工智能领域研究进一步推进,深度学习本身有许多明显优势,针对海量数据处理,深度学习分析能力更强,传统计算工作得到优化,面对不同问题,深度学习的能在模型建立过程中自动不断学习,适应性更强,只需调整参数,就能在不同领域间迁移,在更加复杂的模型场景下,体现出传统机器学习达不到的效果。
1.3 本文研究内容与组织结构
本文查阅了近年国内外文献,分析了现状及不足,针对交通流预测,提出了KNN结合深度LSTM网络的全新方法,主要研究内容如下:
(1)交通流数据时空特征分析与预处理。本文详细分析了路网中各支路流量在时间上有较强的周期性和明显的相似性,一定范围内各个支路上的流量存在空间位置上的关联,并引入KNN算法进行支路相关性度量和筛选。在此基础上,对于检测器上的缺失数据和含噪数据进行补全和去噪处理,使其完整有效而不违背原有的规律。
(2)详细介绍了RNN和单双向LSTM网络的基本结构和工作原理,结合LSTM网络和交通流序列的特性构造合适的预测模型,对深度学习的基本原理、训练过程、参数设置进行简单介绍。
(3)提出深度单双向LSTM网络结构,利用双向LSTM更好的时间特征学习能力和深度结构更好的非线性拟合性,该网络能够同时挖掘时空规律,相比其他智能方法和较浅的网络结构有更稳定的预测性能和预测精度。
(4)从滞后时间、堆叠层数、等多个角度对模型与其他模型进行比较和评估,详细分析了其对预测结果的影响。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: