移动群智感知中的隐私保护研究毕业论文
2020-04-18 20:00:30
摘 要
随着嵌入式设备、物联网、无线传感网络等技术的提出与快速发展,车载设备、智能手机等移动终端形成了众多的传感器,它们拥有强大的感知、计算、通信和存储能力。通过一系列激励机制,利用众多传感器去完成特定的感知任务,这样的思想称为群智感知,但是用户在完成感知任务后上传数据的过程中容易泄露敏感数据,破坏隐私保护,因此如何在保证感知效率的前提下保护用户的隐私是一个亟待解决的问题。
本文介绍了群智感知的概念、模型结构、应用,简单描述了攻击者的攻击模型和手段,对比了各种攻击手段的特点和攻击方式,接下来详细列举了现存的几种隐私保护算法并进行简单的算法描述后分析各自的优缺点,并在此基础上提出了一种基于深度强化学习的隐私保护算法,然后描述了该算法的基本思想和流程,再进行数学建模分析此算法的可行性和高效性,最后利用TensorFlow进行编码测试,进行实验结果对比分析后提出了一些仍然存在需要改进的问题和今后的研究方向。
关键词:群智感知,隐私保护,深度强化学习,马尔科夫决策过程,TensorFlow
Research on Privacy Protection in Mobile Crowd Sensing
Abstract
With the advancement and rapid development of technologies such as embedded devices and wireless sensor networks, mobile terminals like in-vehicle devices and smart phones, have formed numerous sensors that have powerful sensing, computing, communication and storage capabilities. Through a series of incentives, using a variety of sensors to accomplish a specific sensory task is a strategy that named Crowd Sensing. Nevertheless, users may easily disclose sensitive data when uploading data after completing the sensing task. Therefore, how to protect the privacy under the premise of ensuring the efficiency is an exigent issue to be resolved.
This paper introduces the structure , fundamental concept and application of Crowd Sensing, then establish the models of assailant and compare their features. It enumerates several existing privacy protection algorithms and take an analysis on their relative merits. Furthermore, the paper proposes a privacy protection algorithm based on deep reinforcement learning and illustrate its structure and process. Then the feasibility and efficiency of the algorithm are analyzed by mathematical modeling and we use TensorFlow to code, test and analyze the result. Finally, some existing issues and research interests in future are proposed.
Keywords: Mobile Crowd Sensing; Privacy Protection; Deep Reinforcement Learning; Markov Decision Process; TensorFlow
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1课题背景 1
1.2国内外研究现状 1
1.3课题主要研究内容 2
1.4本章小结 2
第二章 群智感知架构介绍 3
2.1 群智感知基本概念简介 3
2.2 群智感知基本结构简介 3
2.3 群智感知网络的典型应用 6
2.4本章小结 6
第三章 群智感知中的隐私保护综述 7
3.1 群智感知面临的隐私泄露威胁 7
3.2攻击者主要攻击方式介绍 7
3.2.1 典型的网络模型 7
3.2.2 攻击模型分析 8
3.3 本章小结 10
第四章 隐私保护策略及算法详解 11
4.1 基于分组统计的策略 11
4.1.1 HP3算法详解 11
4.1.2 M-PERM算法详解 12
4.2 基于K-匿名的策略 16
4.3 基于第三方验证的策略 18
4.3.1 PEPSI算法详解 18
4.3.2 LotS算法详解 19
4.4 本章小结 20
第五章 基于深度强化学习的位置隐私保护策略 21
5.1 基本系统模型 21
5.2 最小抑制率问题 23
5.2.1 任务抑制分析 23
5.2.2 候选集和匿名集的定义 23
5.2.3 候选集与匿名集的计算 24
5.2.4 复杂度分析 26
5.3 马尔科夫链和马尔科夫决策过程 26
5.3.1 马尔科夫链 26
5.3.2 马尔科夫决策过程 27
5.3.3 时间差分法和Q-learning算法 29
5.4 任务决策问题MDP化 30
5.5 基于DQN的抑制率最小化算法 31
5.5.1 DQN算法详解 31
5.5.2 抑制率最小化算法 33
5.5.3 实验与结果分析 35
5.5.4 该算法的不足和今后的研究方向 37
5.6 本章小结 37
第六章 总结 38
参考文献 39
致谢 42
第一章 绪论
1.1课题背景
近年来,物联网、无线传感网络技术发展以及各种移动设备比如智能手机、平板电脑、车载设备的普及使得用户有了非常强大的感知、计算和通信能力。这些已经很大程度上改善了用户的日常生活,但是也剩余了很多的资源,而群智感知的思想正好可以充分地利用这些资源。
群智感知是一种将普通用户的移动设备当做基本感知单元,通过无线通信网络形成一个群智感知网络,利用该网络实现感知任务的分发和感知数据的收集,从而完成复杂、大规模的社会感知任务的技术[9]。群智感知网络在面对数据量大,数据价值密度低的情况尤为适合,在交通检测、健康检测、环境检测、社交领域具有宽广的发展空间。
群智感知主要通过感知个体信息然后从中挖掘出群体信息继而反作用于个个体或群体,所以这个过程中最重要的就是个体和数据,也就是用户和数据。由于需要用户和网络进行协作完成任务,所以十分依赖用户完成任务后上传数据。用户在上传数据的过程中及其容易泄露隐私数据,因此在如何保证服务质量的前提下保护用户的隐私安全是一个及其重要并富有挑战性的问题。
1.2国内外研究现状
移动群智感知网络隐私保护不同于传统传感器网络的隐私保护,主要区别有:(1)数据稳定性不好,由于感知任务者的而完成者是人,所以不存在不变的移动轨迹,用户具有高度的灵活性和移动性,隐私保护需要因地制宜。(2)数据维度变化大,传统的数据类型经常是事先协商或者在协议里定义好的,而现在的移动设备有多种传感器,这些传感器的数据格式很有可能都是不同的,所以用户上传的数据也可能有各种格式存在,同时人们还可以对感知数据进行预处理,贴上自定义的语义标签。根据不同的网络和数据类型往往有不同的攻击方式,需要设计出具有针对性的隐私保护协议。(3)难以监管,用户经常会出现在无法监管的网络环境中,具有背景知识的攻击者可以根据窃听数据和先验信息和进行个体攻击。
针对上述的难点,现存的隐私保护策略主要分为:(1)基于分组统计技术,分组统计法是统计学中的基本方法之一,核心思想是在用户在上传数据时将数据先分成若干份或从n份数据中选择k份,然后将分组过后的数据发送给邻居节点,最后在最终用户或者汇聚节点处进行信息重组和完整性验证。(2)基于第三验证策略,常常用于服务提供商不可靠或不值得信任的时候,在传统的传感器网络中,作为服务提供者或者说储存节点往往更容易遭到攻击,因此这个时候可以在用户和服务器之间添加一个可靠的权威第三方。(3)基于K匿名的策略,K匿名最早由Latanya Sweeney和Pierangela Samarati在1998年提出并由Junade Ali在2010年进行改进,核心思想是组成一个有k个用户的匿名区域,让用户隐藏在k个用户中。
1.3课题主要研究内容
本课题主要是理论研究,内容主要分为以下几个方面:
- 简单介绍群智感知的概念、结构以及应用。
- 列举现存的隐私保护策略,简单介绍其各自已实现的算法并分析其中的差异和优劣。
- 提出一个更完善的算法,并介绍其优点,展示算法的基本流程和实现方案。
- 对比该算法与之前算法的不同以及优缺点。
- 对此算法进行建模分析,并讲解了背后的数学模型包括马尔科夫链,马尔科夫决策过程,DQN模型。
- 利用TensorFlow进行编码分析算法可行性与性能对比,主要是利用卷积神经网络模型和Q-learning模型构造一个DQN,并对此模型进行不同的超参数测试。
- 提出该算法的不足和今后的研究方向。
1.4本章小结
本章主要介绍了本课题的选题背景、国内外研究现状及主要研究内容。
第二章 群智感知架构介绍
2.1 群智感知基本概念简介
群智感知的概念主要来源于众包思想,而众包思想最早可以追溯到2006年的《连线》(Wired)杂志上发明的一个专业术语[36],众包即企业或单位利用网络将工作进行分配,以解决技术问题和发现创意[9]。群智感知将移动感知和众包的思想相结合,将用户的移动作为基本感知单元,通过网络进行无意识或有意识的协作,构成群智感知网络,实现任务分发和感知数据的手机,完成复杂、大规模的社会感知任务[3]。现在市面上的智能手机、可穿戴设备、平板电脑、车载感知设备等移动终端都集成了很多的传感器,且它们具有强大的感知、计算和通信能力,因此构造群智感知网络已具备了客观条件,它的发展也是大有前途的。
在传统的传感网络中,用户仅仅作为感知数据的消费者。相比于此,群智感知网络最要的一个特点是用户要参与数据的感知、分析、传输等系统的每一个过程,可以说用户即是感知数据的消费者,也是感知数据的生产者,可以称为“Prosumer”[9]。这种以用户为核心的群智感知网络有一些新的特征:
(1)网络基建成本低。首先,城市里面已有大量的车辆,用户也自带一部甚至多部移动设备,这些无需专门部门;其次,用户具有高度的灵活性,因此网络的覆盖面积极大,可以促进感知任务发布和数据传输,用户之间也可以互相作为中继节点以进行数据短暂存储和传输。
(2)网络维护更容易。群智感知网络中的节点更强的计算感知能力和更持久的续航,而且大部分节点都有持有者进行维护和管理,能够保证长时间处于正常的工作状态。
(3)网络具有良好的拓展性。相比于其他的无线传感网络需要额外安装传感器,群智感知网络只需要招募更多的用户就可以拓展网络。
2.2 群智感知基本结构简介
如图2-1所示,一个常见的群智感知网络由移动节点和感知平台组成。具体来说,感知平台可以是由中心化的服务器集群组成的数据处理中心,也可以是去中心化的分布式服务器;移动节点的用户则可以利用手机内置的传感器(GPS、摄像头、光线距离传感器等)、可穿戴设备、车载感知设备等收集感知数据后通过无线蜂窝网络或短距离无线通信的方式传送到感知平台上。系统的工作流程大致可以分为以下五个步骤:
(1)感知平台从客户或其他委托者获取感知任务,然后通过广播通知所有的移动用户并告知本任务的激励机制。
(2)收到通知后,用户选择是否参加此次感知任务。
(3)参与的用户需要在任务时限之前到达指定的地区,然后利用携带的移动设备的传感器进行感知,然后将感知数据上传到感知平台,感知数据会由平台或者中间节点进行加密保护。
(4)将所有用户上传的数据进行加工和分析之后,感知平台利用这些数据构建各种应用或进行研究。
(5)感知平台进行数据评估之后,按照对应的激励机制对完成感知任务的用户进行补偿。
图2-1 群智感知网络基本结构图
2.3 群智感知网络的典型应用
由于群智感知网络具有更强大的计算通信和感知能力,因此已经逐渐应用到了以下领域:
1、公共设施管理。主要应用于交通拥堵情况的监测、寻找空闲停车位、道路状况的检测和公共设施报修等。例如,ParkNet利用超声波传感器和GPS检测空停车位,并共享检测结果;GreenGPS采集用户的车载信息,查询车辆的燃油消耗信息,从而为用户选择燃油更少的绿色出行路线[24]。
2、环境监测。相比于传统的无线传感网络,群智感知网络具有大量的高性能设备作为优势,因此可以进行大规模、广区域的环境监测。例如,iMap利用手机收集人的地点-时间轨迹,同时计算空气中PM2.5的值和二氧化碳的含量;Ear-Phone和NoiseTube利用手机的麦克风测量周围的环境噪音,并可以通过所有用户手机的数据构造环境噪音地图[36];CreekWatch利用用户提供的文本描述和拍摄的照片来记录不同地方的垃圾数量和水质,可以监测水质污染[23]。
3、社交服务。例如,in2GPS应用利用GPS构建相片库,用户可以通过上传拍摄的照片来查询自己所在的位置;DietSense通过用户上传到社交网络中所吃食物的照片来分析和比较他们的饮食习惯,从而可以提出合理的饮食计划和建议。
2.4本章小结
本章主要介绍了群智感知的基本概念、结构和已涉及的应用领域。
第三章 群智感知中的隐私保护综述
3.1 群智感知面临的隐私泄露威胁
群智感知网络虽然可以利用多用户的高性能移动设备完成复杂度高的任务,但是这也增加了泄露用户隐私数据的风险。例如,Petrol-Watch和MobiShop分别利用群智感知网络收集用户附近石油和超市商品价格,从而帮助人们买到更加优惠的产品,但是由于用户收集的感知数据与商家的利益有直接关联,攻击者很有可能篡改这些数据,误导用户大量购买[36];GreenGPS等涉及到用户运动轨迹的应用就有可能泄露用户的出行轨迹。当隐私受到威胁时,用户会失去参与感知任务的积极主动性,影响感知任务的实施,因此对用户隐私进行合理的保护是一个及其关键并且具有难度的问题。
3.2攻击者主要攻击方式介绍
3.2.1 典型的网络模型
2.2节简单的介绍了群智感知的网络结构,由于需要讨论隐私保护,所以将该网络结构进行进一步的细化,如图3-1,主要分为参与者(Worker或Mobile Nodes,MNs)也就是用户、请求者(Requesters)、服务提供者(Service Provider,SP)、注册验证者(Registration Authority,RA )和外围组件(如网络接入点、数据处理器)。上述前4部分主要通过外围组件进行连接和通信。
用户往往拥有高性能的移动设备,当用户想要加入某一个群智感知网络的时候,该用户需要先向RA注册移动设备。等RA验证完成后,会为该用户的设备绑定认证信息,任务请求及下达可以由SP完成,用户可以根据自己的实际情况选择是否完成该任务,当感知任务完成后用户再把数据传输到SP。最后一个阶段称为数据上传阶段,这个阶段最容易受到攻击者攻击,因此是现在隐私保护研究的重点。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: