基于深度学习的交通流预测方法研究毕业论文
2020-02-15 23:32:51
摘 要
本文借助建模仿真软件Matlab针对收集到的某一路段不同探测器所探测到的交通流量数据,利用深度学习的CNN(卷积神经网络)算法进行了深度学习,并对未来某段时间的短时交通流量进行了预测。利用深度学习的卷积神经网络算法对交通流进行特征识别与预测,所得结果对于预测交通流量,规划交通路线具有重要的指导意义。
论文主要研究了CNN除了在图像识别领域的应用之外,对于交通流量这种数据类型是否依然能准确地捕捉其数据特征,从而较为准确地对交通流量未来若干个单位时间内的数值进行预测。
研究结果表明CNN算法在一定程度上可以识别出某一时刻短时交通流的数据特征,并根据下一时刻的数据特征来预测下一时刻的短时交通流,对于精确的交通流量来说,CNN可以在一定误差范围内得到交通流量的近似值,而对于转化为交通拥堵程度之后的数据来说则预测结果会显得更加精确。
本文的特点是将CNN这一图像识别领域常用的深度学习算法应用到数据分析与预测当中,探究了CNN算法在数据分析与预测领域应用的可能性。
(1)在数据处理方面,我们尝试了将交通流数据特征转化为了二维矩阵形式来将其看作图像供CNN训练与识别。在将数据处理成二维矩阵的过程中,我没有加入其它检测器的数据来构成二维矩阵,这样会显得矩阵的大小具有局限性而是将同一探测器的已有历史交通流量按照相同的规律分布成N×N矩阵,从而使得矩阵的大小可以自由调节。
(2)在卷积核大小的调整与其他参数的设定方面,我通过调节卷积核大小与下采样操作的比例来将最后单层感知机接受的特征图控制在2×2,这样类似于其在做图像识别的特征图尺寸,来达到降低误差的效果。
(3)在降低MSE(均方误差)方面,由于我们的数据波动范围较大的真实数值,这就导致均方误差比较大。因此,我将交通流数据按取值范围分成了1-5共5个等级来代表交通拥挤程度,代入后降低了MSE的大小。
关键词:卷积神经网络;短时交通流量;交通流量预测
Abstract
In this paper, with the help of modeling and simulation software Matlab, the traffic flow data detected by different detectors in a certain road section are collected, the CNN (convolutional neural network) algorithm of deep learning is used to carry out deep learning and the short-term traffic flow in a certain period of time in the future is predicted.
The convolutional neural network algorithm based on deep learning is used to identify and predict traffic flow features, and the results obtained are of great guiding significance for traffic flow prediction and traffic route planning. In addition to the application of CNN in the field of image recognition, this paper mainly studies whether the traffic flow data type can still accurately capture its data characteristics, so as to accurately predict the future value of traffic flow in a number of unit times.
Research results show that CNN algorithm to a certain extent, can identify the data characteristics of short-time traffic flow at a certain moment, and according to the data characteristics of the next moment can be used to predict the short-term traffic flow of the next moment, for accurate traffic flow, CNN can get traffic flow within a certain range of error of approximation, and for data into traffic congestion degree after forecast results will appear more accurately. This paper features the application of CNN, a common deep learning algorithm in the field of image recognition, to data analysis and prediction, and explores the possibility of the application of CNN algorithm in the field of data analysis and prediction.
(1)In terms of data processing, we tried to convert the traffic flow data features into a two-dimensional matrix form to regard them as images for CNN training and recognition. In the process of processing data into a two-dimensional matrix, I did not add data of other detectors to form a two-dimensional matrix, which would show the limitation of the size of the matrix. Instead, the existing historical traffic flow of the same detector was distributed into an n×n matrix according to the same law, so that the size of the matrix could be adjusted freely.
(2)In terms of the size adjustment of the convolution kernel and the setting of other parameters, I control the final feature graph accepted by the single-layer perceptron at 2×2 by adjusting the ratio between the size of the convolution kernel and the down-sampling operation, which is similar to the size of the feature graph in image recognition, so as to reduce the error.
(3)In terms of reducing MSE (mean square error), due to the real value with a large fluctuation range of our data, the mean square error is relatively large. Therefore, I divided the traffic flow data into 5 levels ranging from 1 to 5 according to the value range to represent the degree of traffic congestion, which reduced the size of MSE.
Key Words:Convolutional Neural Network; Traffic Flow Prediction; Short-time Traffic Flow
目 录
第1章 绪论 1
1.1 研究背景 1
1.2 研究的目的与意义 1
1.3 国内外研究现状 2
1.3.1 交通流预测方法 2
1.3.2 深度学习预测方法 2
第2章 深度学习与卷积神经网络理论 4
2.1 深度学习概述 4
2.2 稀疏自编码器(SAE) 4
2.3 深度置信网络算法(DBN) 4
2.4 卷积神经网络(CNN) 5
2.4.1 卷积层与卷积操作 6
2.4.2 下采样层与池化操作 8
2.4.3 全连接层操作与尾部单层感知机 8
第3章 基于卷积神经网络的交通流预测模型 9
3.1 预测模型问题描述 9
3.2 卷积神经网络结构设计 10
3.3 数据处理方法 10
3.3.1 数据补充 10
3.3.2 数据转化 10
3.4 模型代码解析 11
第4章 交通流预测模型实例研究 14
4.1 数据处理过程 14
4.1.1 数据获取 14
4.1.2 数据预处理 14
4.2 实验结果与分析 16
4.2.1 交通流预测结果 16
4.2.2 交通流等级预测结果 17
4.2.3 实验结果分析 18
第5章 总结与展望 21
5.1 工作总结 21
5.2 展望 21
参考文献 22
致 谢 24
第1章 绪论
本章首先介绍了交通流预测相关研究的背景与发展过程,分析了短时交通流预测对于交通运输领域的重要作用与指导意义。紧接着,本章将介绍深度学习卷积神经网络算法的起源与发展,以及其具备的理论特点并介绍其在各个领域的应用。之后,本章将指出本文的研究目的与实际意义,通过对国内外短时交通流量预测方法的分析与研究成果的比较,来明确短时交通流量预测的核心问题,并阐述本文的研究结果与组织框架。
1.1 研究背景
在现代社会中,城市和高速公路上的车辆数量一直在增加。因此增加的有关许多问题,例如交通拥堵,可能会导致出行浪费更长的时间,从而导致资金损失以及交通事故概率的增长。获取准确及时的交通流信息对于出行者来说是必要的。随着当前交通流量数据的爆炸性增长,使用大数据预测交通流量对于确保安全旅行和设计高效导航至关重要,这可以帮助出行者做出明智的出行决策并改善公共安全。
深度学习是一种新的机器学习方法,它通过构建多层模型来实现准确的有用特征图像分类或对象识别。这种方法可以超越概念学习,具有学习更复杂知识的能力。深度学习已成功应用于预测任务,自然语言处理,对象检测和运动建模。由于交通流量预测本质上是复杂的,因此可以使用深度学习算法来表示没有先验知识的交通特征,这对于交通流量预测表现出良好的性能。
近年来,深度学习作为一种新的机器学习方法开始受到研究人员和商业人士的广泛关注。深度学习是一种包含多个隐藏层的多层感知器,通过学习一种深层的非线性网络结构来实现复杂的计算,从而更好地还原交通系统的状态,进一步达到交通流预测的目的。伴随IPv6、无线通信技术和传感技术的发展,智能交通逐渐融合了短程无线通信技术、微电子传感技术、嵌入式传感网络等技术。智能交通物联网将智能交通的基本理念与物联网技术产业相结合,给智能交通带来了一次全新的升级,但这也随之带来了巨大的交通数据量,仅广州每天就有超过12亿条的交通流量数据记录被创建,产生的数据量为150G~300GB。传统的方法根本无法解决如此庞大的数据量,通过深度学习进行交通大数据分析、预测已成为必然趋势。
1.2 研究的目的与意义
先进的智能交通系统离不开基础交通数据的处理,目前智能交通领域存在多种数据采集处理方式,同时也为ITS提供了多维的交通数据,如何让这些数据有效地应用于ITS已经成为目前研究的热点。交通流预测也是交通数据处理的一种方式,精确的交通预测信息能够替出行者提供有效的出行决策依据,同时也可以让驾驶员选择更为畅通的道路出行,从而减少甚至避免交通拥堵的状况。在交通流预测方面,目前主要有基于线性统计理论的预测模型和基于智能理论的预测模型等。
对于物流企业来说,物流时效是衡量一家物流企业服务质量的重要指标之一。将交通流量预测的结果及时反馈到物流线路的规划当中,这会有助于物流企业做出更加高效的资源调配与更加合理的线路规划。因此,进行短时交通流量预测对于物流行业提升服务质量,提高物流时效也有着十分重要的意义。
1.3 国内外研究现状
1.3.1 交通流预测方法
早在20世纪70年代,自回归综合移动平均(ARIMA)模型就被设计用于短期高速公路交通流量预测。从那以后,许多研究调查了交通流量预测。这些方法可分为三类:参数方法,非参数方法和混合方法。参数技术是基于ARIMA的模型和卡尔曼滤波模型,它们基于时间序列方法。J.Kong[1]等人使用一个参数(即速度)来有效地预测交通状态,其中信息由全球定位系统(GPS)收集并且使用曲线拟合和车辆跟踪机制。然而,由于交通网络的复杂性,交通流量呈现出随机和非线性的质量。时间序列方法在预测交通流量方面往往效率低下。
从交通网络的角度来看,研究非常重视非参数方法。目前广泛使用的非参数方法包括k-最近邻(k-NN)方法,贝叶斯网络方法,在线学习加权支持向量回归(SVR)和人工神经网络(ANNs)。H.Chang[2]等人提出了一种动态多区间交通量模型,该模型基于k-NN非参数回归(KNN-NPR)。库马尔[3]等人提出了一种用于交通流量预测的贝叶斯网络方法。Jeong[4]等提出了一种用于短期交通流预测的在线学习加权支持向量回归方法。库马尔等人短期应用人工神经网络(ANN)模型交通流量的预测,其中交通量,速度,密度,时间和星期几被作为输入变量。为了获得自适应模型,一些研究探索了混合方法,它结合了几种技术。尽管混合方法是自适应的,但很难说在任何情况下一种方法优于另一种方法。造成这种困难的一个原因是,与大流量数据相比,所提出的方法是使用少量数据开发的。此外,交通流量预测的准确性取决于嵌入在时空交通数据中的特征和外部因素。
1.3.2 深度学习预测方法
近年来,深度学习正逐渐被运用到交通流运用中并逐渐成为主流的预测方法。哈尔滨理工大学的康丹青[5]在学术论文中提到了基于LSTM(循环神经网络)模型的短时交通流预测方法,并将其与CNN相结合构成了混合神经网络模型并模拟了四种不同的组合得出了一个预测效率较高的模型。青岛大学的王晓杰[6]则在CNN的基础上加入了迁移学习的思想,在已有的用CNN训练好模型基础上混合了几种不同时间间隔的数据进行共同训练,对模型进行了优化,提升了预测精度。瓦桑塔[7]使用了卡尔曼滤波算法进行交通流预测,取得了不错的效果。Zheng Zhu[8]等人则提出了线性条件下基于贝叶斯网络的短时交通流预测方法,在研究中考虑了速度因素和空间因素来提高预测精度。类似地,大连理工大学的朱勇[9]
也提出了一种基于时空关联混合模型的交通流方法预测,并在其论文中将地理信息进行网格化并引入Attention机制来更准确地进行预测。
本文在结构上一共分为五章:
第一章是论文绪论部分。其中包括了背景介绍、研究目的与意义、对交通流预测方法的国内外研究现状进行的简要阐述,对论文的研究内容、研究思路、研究方法及技术路线进行阐明。
第二章是理论基础。包括对当下较为流行的深度学习算法进行简单介绍,对国内外使用较为普遍的交通流预测方法的介绍以及对卷积神经网络算法的步骤与原理进行详细的介绍与分析。
第三章是模型建立。包括本文研究的短时交通流量预测模型的构造思路,对交通流量数据的转化规则与输入输出矩阵的建立规则进行解释。这一章将会详细介绍模型建立的具体步骤及实现过程。
第四章是实例应用。主要是对收集到的交通流数据进行处理并输入到模型当中,进行运算。CNN将会运用收集到的不同时刻交通流量数据验证并分析模型,并将其与之前的研究结果进行对比分析。
第五章是结论与展望。主要是基于本文实验结果作出总结, 简要提出短时交通流量预测为旅客出行能够带来的诸多便利,总结本文研究的不足,并展望未来短时交通流预测的研究方向。
第2章 深度学习与卷积神经网络理论
2.1 深度学习概述
深度学习是一种替代了传统浅层学习的新的机器学习方法,它的主要特点是能够使用多层优化的方法,逐层对参数进行调整,进而提高机器学习的学习能力。对于特征提取方面,由于多隐含层的存在,深度学习会有更好的特征提取效果。相应地,深度学习的识别能力也会大幅度的提高。由此可知,深度学习的优势在于可以对多层进行逐层初始化,从而完成无监督学习的任务。由于深度学习对数据特征识别方面有非常好的效果,其经常被运用于预测模型中,来补充甚至代替传统的统计学预测方法。
在人工智能领域,深度学习是最为领先的智能算法,因为它是模拟了人脑的学习方式。由于网络化神经元具有多层结构,深度学习保证了极高的学习效率和预测精确度。下文简单介绍了几种深度学习算法,并着重介绍了本次实验用于预测交通流量的卷积神经网络算法。
2.2 稀疏自编码器(SAE)