时空数据发布中的移动轨迹去匿名化算法研究开题报告
2020-02-18 19:26:09
1. 研究目的与意义(文献综述)
随着社会的发展和科学技术的不断进步,移动通信和传感设备等位置感知技术搜集了大量的用户位置信息,并对其进行相关分析,发现潜在有用信息,合理运用,能够大大促进现代社会的智能化发展。而与此同时,人们也越来越担心运营商对位置的搜集会造成个人隐私的泄露,由此对个人生活产生负面影响。隐私的攻防已经成为当今信息时代中一个热门研究方向。
因特网服务提供商(internet service providers, isp)越来越多地收集匿名用户移动轨迹,以协助学术研究和商业应用,如网络优化,用户人口估计和城市规划等,给各种应用程序的开发带来了便利。与此同时,isp数据的详细位置跟踪包含有关个人用户的敏感信息( 例如家庭、工作地点、个人习惯等),如若泄露,会给个人生活带来一定的风险。即使数据是匿名的人们仍然越来越担心用户可以通过外部信息( 如社交网络信息等) 重新识别。最近,美国国会已着手废除互联网隐私规则,并将isp用户数据的共享(或商用)合法化。用户对isp数据的共享也存在着疑问:如果将isp匿名轨迹数据集共享,有多少用户隐私被泄露?
为了研究isp数据共享下的用户隐私泄露问题,早期的研究通过评估轨迹的“唯一性”来估计理论上的隐私界限。如“on the validity of geosocial mobility traces”的研究中表明轨迹去匿名化是非常容易的,即在有4个时空点或访问量最高的3个地点的条件下,80%-95%的用户可在城市中被重新唯一识别。
2. 研究的基本内容与方案
2.1 研究内容和目标
研究的基本内容:本次设计首先在hmm、hist等现有算法的基础上对轨迹隐私去匿名化算法进行分类,在真实数据的基础上运行现有算法,并分析结果和对各种算法进行评估。分析现有算法不佳原因,主要为时空不匹配以及数据稀疏。针对这两个问题设计新的算法,使其能够更适用于真实轨迹数据的去匿名化。
研究目标:设计一个适用于真实数据的轨迹去匿名化算法,并验证其效果,完成资料整理和论文编写。
3. 研究计划与安排
第1-3周 查阅相关文献资料,明确研究内容,了解现有的轨迹去匿名化算法的原理及方法,完成开题报告。
第4-7周 进一步阅读相关文献,在真实数据的基础上对现有的轨迹去匿名话算法进行分析,研究其存在的缺陷。
第8-10周 设计新的算法,重点要求能够弥补现有算法的缺陷,使其更适用于真实用户数据。
4. 参考文献(12篇以上)
- ma c y t , yau d k y , yip n k , et al. privacy vulnerability of published anonymous mobility traces[c]// sixteenth international conference on mobile computing amp; networking. acm, 2010.
-
naini f m , unnikrishnan j , thiran p , et al. where you are is who you are: user identification by matching statistics[j]. ieee transactions on information forensics amp; security, 2015.
-
riederer c, kim y, chaintreau a, et al. linking users across domains with location data: theory and validation[c]// international conference on world wide web. 2016.
-
shokri r, theodorakopoulos g, boudec j y l, et al. quantifying location privacy[c]// security amp; privacy. 2011.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付