基于机器学习的轨迹数据分析与可视化文献综述
2020-06-22 23:02:16
1.研究背景及意义
移动互联网、卫星定位、LBS(Location-Based Service)等技术的不断发展,使得带有定位功能的移动智能设备被广泛使用。人们在使用这些设备的同时也主动或被动地记录了大量的历史移动轨迹,并被持久化保存,形成了时空轨迹(spatial-temporal trajectories)数据。时空轨迹是地理空间加上时间轴所形成的多维空间中的一条曲线,可以表示移动对象在一段较长时间范围内的位置变化。每段轨迹由一系列时空采样点构成,其中每个采样点记录了经纬度、时间、速度、甚至人与社会交互活动等信息,刻画了人们在时空环境下的个体移动和行为历史。从宏观角度来看,轨迹数据中不仅蕴含了群体对象的泛在移动模式与规律,例如人群的移动与活动特征、交通拥堵规律等,还揭示了交通演化的内在机理。在大数据时代,人们通过轨迹分析等手段进行知识发现,并将它们运用在各种交通和位置服务应用系统中,包括交通导航、城市规划、服务推荐、交通指挥、物流配送、车辆监控等。在此背景下,轨迹大数据管理被学术、工业界大量研究,轨迹数据分析与挖掘已经成为数据挖掘领域的一个重要的新兴分支。但是随着数据规模的指数级增长,应用需求的飞速提升,现有的轨迹数据存储、计算和分析方法面临诸多局限,亟需突破轨迹数据的处理架构、分布式算法等关键技术。基于机器学习的轨迹数据分析是指用机器学习中的算法,如随机森林(Random Forest)、线性回归(Logistic Regression)、支持向量机(Support Vector Machine, SVM)等分类器以及主成分分析(Principal Components Analysis, PCA)、t分布随机邻居嵌入(t-Distributed Stochastic Neighbor Embedding, t-SNE)等降维算法对轨迹数据进行数据分析。
2.轨迹数据分析的应用
轨迹数据记录了人类的活动和行为历史,蕴含了群体性的移动模式和规律。轨迹数据的分析被广泛应用于智能交通、位置服务等系统。具体应用大致分为以下几个方面:
1)交通路况预测与导航。综合运用历史事件、时空、活动、天气等多维信息,通过轨迹数据分析来深入理解交通路况特征和拥堵的演化模式,获取实时的交通态势,为用户提供道路预警;构建数据驱动的城市交通指挥体系,做到及时主动的指挥调度;引导智能化的交通导航,为导航用户提供准确的行出行导航服务。
2) 个性化服务与活动推荐。深入分析用户社交媒体中的轨迹数据,包括对轨迹行为的理解、用户特征的刻画、用户行为模式的挖掘等。针对用户对多个目的区域的活动描述,为用户推荐能够满足查询意图的商家或个性化的服务与活动。考虑轨迹行为和用户体验(基于情感分析),为观光旅客推荐符合用户兴趣和个性化景点、路线。根据用户的驾驶路线推测目的地和出行意图,进行基于位置的精准广告投放。
3) 城市规划。通过轨迹计算分析城市不同区域的社会功能、热度特征,确定这些城市区域的性质、规模和发展方向,提炼城市内、城市间的交通流模式。这些信息被用于指导城市开发、建设和管理,使有关部门能够合理利用土地资源,协调城市的空间布局,为城市建设、重大施工提供决策辅助;为机构、商家和各类活动的选址需求提供解决方案;优化城市公交、地铁等公共服务线路。
3.轨迹数据分析技术现状
轨迹大数据作为大数据的一种,其丰富的数据来源与多样化结构符合大数据的”3V”特征,即量大(volume)、实时(velocity)、多样(variety)。轨迹数据作为轨迹大数据处理的对象,需要在充分了解其来源、特征与处理技术架构的情况下挖掘其中有价值的信息。轨迹数据分析技术可以被大致分为为轨迹数据预处理(Trajectory Data Preprocessing)、轨迹索引与检索(Trajectory Indexing and Retrieval)、轨迹模式挖掘(Trajectory Pattern Mining)、轨迹数据隐私保护(Trajectory Data Privacy Preserving)。
轨迹数据预处理中主要的方法包括原始数据的数据清洗、轨迹压缩和针对应用场景与挖掘目标的轨迹分段与路网匹配预处理方法。特别地提出停留点检测技术,一般对于轨迹数据的挖掘研究很多都是围绕轨迹停留点展开研究,同时轨迹压缩技术在海量数据的分析中消减无用数据、提升数据分析能力具有重要作用。