基于L-多样性的数据发布系统应用与研究开题报告
2020-03-20 23:46:40
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
随着大数据时代的到来,信息资源已成为社会发展与国家安全的重要战略资源。“深入推进供给侧结构性改革”被列入李克强总理对2018年政府工作的头条建议。其中第一项就最先谈到实施大数据发展行动,“发展壮大新动能”。毫无疑问,大数据作为引擎,给我们带来了智能导航、无人车驾驶、图像识别、天眼监控等的便利,但高度个人化的大数据的商业价值注定它极易成为黑客或泄密者觊觎的重要目标,如何防止在背后承担着驱动算法不断优化迭代的数据被泄露,是科学研究者的重要课题。
相较以往,信息技术的发展让信息共享更加容易和方便,以信息共享和数据挖掘为目的数据发布过程中隐私泄露问题也日益突出。2016年7月,微软window10因未遵守欧盟“安全港”法规,过度搜集用户数据而遭到法国数据保护监管机构cnil的发函警告。2017年9月,美国最大征信巨头之一伊奎法克斯公司(equifax)数据库被“黑”,面临用户集体起诉的5500亿加元(约合4500亿美元)赔偿。隐私的保护问题乃是数据安全发布的重中之重。
2. 研究的基本内容与方案
本文以基于java的订单管理发布系统为背景,利用k-匿名和l-多样性模型组成的匿名算法系统对数据进行处理,设计并完成一套基于java的订单信息安全发布系统。
本文研究问题的目标是在保证隐私不被泄露的情况下,最大程度上地提高变换后的数据可用性,使数据研究者从变换后的数据中挖掘的知识尽可能与原始数据中可挖掘的知识一致,k-匿名保证了攻击者不能判别隐私信息所属具体个体,l-多样性模型建立在满足k-匿名原则基础上,解决属性链接,除了等价类中的元组数大于k,还要求每个元组至少有l个敏感属性。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1] bin zhou and jian pei.the k-anonymityand l-diversity approaches for privacy preservation in social networks againstneighborhood attacks[j].knowledge and information systems,2011,vol.28(1): 47-77
[2] riccardo dondi;giancarlo mauri;italozoppis.the l-diversity problem: tractability and approximability[j].theoreticalcomputer science,2013,vol.511: 159-171
[3] a. machanavajjhala et al. l -diversity:privacy beyond k –anonymity[j]. acm transactions on knowledge discovery fromdata (tkdd), 2007, vol. 1, (1), pp. 3-es.