登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 计算机科学与技术 > 正文

基于机器学习的位置大数据特征提取文献综述

 2020-06-23 20:44:06  

文 献 综 述

1. 研究背景和意义

大数据时代下,移动互联网发展与移动终端的普及形成了海量GPS数据。位置获取和移动计算技术的进步使得人们可以用一系列时间戳记的位置记录历史位置,从而产生大量的轨迹。轨迹数据含有丰富的 时空特征信息,通过轨迹数据处理技术,可以挖掘人类活动规律与行为特征、城市车辆移动特征、大气环境变化规律等信息。海量的轨迹数据也潜在性地暴露出移动对象行为特征、兴趣爱好和社会习惯等隐私信息,攻击者可以根据轨迹数据挖掘出移动对象的活动场景、位置等属性信息。首先,轨迹数据预处理方法,包括噪声滤波、轨迹压缩等;其次,轨迹索引与查询技术以及轨迹数据挖掘已有的研究成果,包括模式挖掘、轨迹 分类等;轨迹大数据支撑技术,如处理框架、数据可视化;轨迹数据处理中应用机器学习的可能方式,目前轨迹数据处理中所使用的核心算法所对应的机器学习算法实现。

2.研究现状

伴随着移动互联网设备的普及和 LBS 应用的发展,轨迹数据挖掘已成为国内外数据挖掘领域的研究热点。然而对移动轨迹数据的挖掘需要同时考虑时间特征与空间特征,并且数据源具有多源异构等特点,这为轨迹数据挖掘工作带来极大挑战。目前,国内外轨迹数据的挖掘研究工作主要集中在以下三个方面:轨迹数据描 述建模、轨迹数据语义提取和轨迹数据关联关系挖掘。

2.1 轨迹数据描述模型研究

轨迹数据是对移动对象在一段时间内的时空状态采样所获取的数据信息。这些信息包括位置、时间、事件等,将这些上下文信息按采样先后顺序排序便形成了移动对象的轨迹数据。轨迹数据的获取主要采用三种采集方式:1)基于时间采样;2)基于位置采样;3)基于事件采样。根据采样技术不同,Spinsanti, Pelekis 和Theodoris将轨迹数据类型区分为 GPS (Global Positioning System)数据,GSM (Global System for Mobile Communications)数据和 Geos-social network 轨迹数据以及基于 RFID (Radio Frequency Identification)信号和基于 WiFi 信号的轨迹数据。由于采集方法的不同,各类轨迹数据的精度存在差异。

在轨迹数据表达方面,常见的时空轨迹数据表示方法有三种:1)基于三维坐标的描述;2)基于热点、区域的描述;3)基于地理标示的描述。最通用的方法是对轨迹的可视化三维 (x, y, z, t) 时空立方体表达方法,(x, y, z)为空间位置,t为采样时间点。在三维可视中,除了表达时空轨迹外,还可以表达个体活动 (x, y, z, t, context) 类型,context 为位置点相关的上下文信息。针对群体用户的移动行为建模,采用基于 Agent 的模型 ABM (Agent-Based Model),该模型可以用于模拟大量 Agent 之间的行为和交互过程,从而实现模拟复杂系统的宏观特征。

目前轨迹数据的表示和建模方法有许多方法,但是这些方法未能完全描述数据本身的内在关联与含义。

2.2 轨迹数据语义挖掘研究

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图