基于张量分解的路径行程时间预测研究与实现毕业论文
2021-11-02 20:44:18
摘 要
本文主要研究出租车查询路径实时行程时间的准确预测问题。借助北京市多辆出租车采集到的GPS轨迹数据,本文对不同司机在不同时间段经过不同路段所需的行程时间进行三维张量建模,利用信息张量分解解决路段实时行程时间的数据稀疏问题;利用采集到的轨迹数据分别建立频繁轨迹模式、后缀索引结构,加快行程时间计算的检索过程并且提高预测的准确性;根据目标函数的比较得出在最优连接下查询路径的实时行程时间。
通过与其他方案的实验仿真比较,本文提出的预测方案在准确性上优于其他方案;同时,本文还探究后缀索引结构深度、使用司机的数量对预测准确性的影响,以及预测不同长度查询路径的准确性。所得结果对出租车路径实时行程时间的准确预测有重要的指导意义。
关键词:实时行程时间准确预测;信息张量分解;频繁轨迹模式;后缀索引结构;目标函数
Abstract
This paper mainly researches the accurate prediction of real-time travel time of taxi query path. Based on the GPS trajectory data collected by many taxis in Beijing, this paper models the travel time of different drivers passing through different roads in different time periods with 3D tensor, using information tensor decomposition to solve the data sparsity of real-time travel time. With the help of these trajectory data, frequent trajectory pattern and suffix-index structure are established to speed up the retrieval process of travel time calculation and improve the prediction accuracy. According to the objective function, the real-time travel time of the query path under the optimal concatenation is obtained.
Compared with other schemes, the accuracy of the proposed scheme is better than that of other schemes. At the same time, this paper also explores the influence of the structure depth of the suffix-index structure and the number of drivers on the accuracy of the prediction, as well as the prediction accuracy of query paths of different lengths. The results have important guiding significance for the accurate prediction of the real time travel time of taxi routes.
Key Words:real-time travel time accurate prediction;information tensor decomposition;frequent trajectory pattern;suffix-index structure;objective function
目录
第1章 绪论 1
1.1 研究背景、目的及意义 1
1.2 国内外研究现状 1
1.3 本文研究及组织结构 3
第2章 基于张量分解的路径行程时间预测模型 5
2.1 路径行程时间实时预测存在的问题及相关概念 5
2.2 信息张量分解 7
2.2.1 路段-司机-时间段三维张量建立 7
2.2.2 信息矩阵建立 8
2.3 最优连接 10
2.3.1 频繁轨迹模式 10
2.3.2 后缀索引结构 11
2.3.3 目标函数 12
2.4 用于比较的其他路径行程时间预测方法 13
2.4.1 基于路段限速的路径实时行程时间预测方法 13
2.4.2 基于简单路径连接的路径实时行程时间预测方法 14
2.4.3 基于最优连接和历史行程时间的路径实时行程时间预测方法 14
2.4.4 基于最优连接和非负矩阵分解的路径实时行程时间预测方法 14
第3章 基于张量分解的路径实时行程时间预测算法 16
3.1 信息张量分解算法 16
3.2 最优连接算法 17
3.3 基于张量分解的路径实时行程时间预测算法的总体实现 19
3.3.1 信息张量分解的实现 20
3.3.2 Visual Studio中使用的所有类 20
3.3.3 CatdDataProcess处理部分 21
3.3.4 最优连接处理部分 22
第4章 实验及分析 24
4.1 实验数据 24
4.1.1 原始数据 24
4.1.2 实验中使用的张量和信息矩阵、 25
4.2 实验平台 26
4.2.1 Matlab R2016b 26
4.2.2 Visual Studio 2019 27
4.3 实验分析 27
4.3.1 频繁轨迹模式深度对预测准确性的影响 28
4.3.2 后缀索引结构深度对预测准确性的影响 29
4.3.3 使用司机数量对预测准确性的影响 30
4.3.4 各个方案实验比较 31
4.3.5 OC TD对不同长度的查询路径的预测准确性 32
4.4 实验总结 34
第5章 结论 35
致 谢 36
参考文献 37
第1章 绪论
1.1 研究背景、目的及意义
当前,随着越来越多的城市人口不断增多,交通拥塞问题在一定程度上影响了城市的整体发展。交通拥塞不仅影响了人们日常出行及工作,使得驾驶人员更加容易烦躁易怒,影响了城市的整体面貌;而且也极大地浪费了燃料资源,进一步增加了我国环境污染程度,也在一定程度上致使全球气候变暖的情况日益严重。所以,城市交通拥塞问题亟待缓解或得到解决。
而与此同时,城市的数字化、信息化和智能化建设也在不断深入。所谓的信息化是指系统可以完成数据的自动采集、处理分析,传输分发,自动与半自动智能化决策功能[1][2];由此看来,信息化作为智能化的基础,而智能化又能进一步优化信息化。从信息化实现的过程,我们可以看到在城市智能化建设中,采集数据信息成为了必不可少的一个环节。在这个数据信息爆炸的时代,可以用作分析的数据多种多样,如地理信息、交通信息、移动信号信息等等;而交通信息作为能够较直观反映交通情况的数据信息,为缓解或解决城市交通拥塞问题提供了新思路,即用分析交通数据信息实现城市交通的智能化管理。
利用交通信息分析得到的行程时间在实现城市智能化管理中扮演着十分重要的角色。所谓的行程时间是指车辆或人从一个起始端到一个目的端所花费的时间;可以是在某一路段上,也可以是由多个路段组合成的一条路径上。就目前而言,行程时间被广泛应用于出行规划、车辆派遣及交通监测等方面。现下常用的导航软件百度、高德等,利用预测的行程时间,结合当前交通情况,为出行者提供了合理出行规划和出行时间预测;而像滴滴等车辆派遣软件也同样借助行程时间便利车辆载人出行。所以行程时间的研究及应用可以极大地提升出行者的便利性、增加交通运作效率、优化交通管理,从而整体上改善城市交通拥塞问题,优化我们的生存空间。