联邦学习中的外部性(Externalities)分析与优化毕业论文
2021-11-08 21:24:47
摘 要
在一个每天都会产生海量数据的信息时代,人们越来越注重对个人隐私安全的保护。而在担心隐私泄露的同时,大量数据的交互合作又可以给生活带来更多的便利。因此急需一种既能保护个人隐私又能促进数据合作的新型机器学习模式,那就是联邦学习。本课题研究的是一种基于市场交易理论的三方联邦学习交易模型,并考虑各个联邦学习参与者的外部性,建立其对应的效用模型。在建模后,使用斯塔克伯格博弈模型对各个参与者的决策进行优化,找到各个参与者决策的最优解。然后根据最优解,按照效用函数的影响因素分类,给出各个参与者效用随影响因素变化的图像并进行分析。
关键词:联邦学习;外部性;斯塔克伯格博弈
Abstract
In an information age where massive data are generated every day, people pay more and more attention to the protection of personal privacy security. While worrying about privacy disclosure, the interaction and cooperation of a large number of data can bring more convenience to life. So we need a new machine learning model which can protect personal privacy and promote data cooperation, and that is Federated Learning. This paper concentrates on a three-party transactionmodel of FederatedLearning which is based on market transaction theory, and establishes its corresponding utility model considering the externalities of each participant in federated learning. After modeling, Stackelberg Game model is used to optimize the decision-making of each participant and find theirbest solution. Then, according to the optimal solution, the images of each participant's utility are given and analyzed, which are clarified by the influence factors of utility function.
Key Words:Federated Learning; externality; Stackelberg Game
目录
第1章 绪论 1
1.1研究背景与现状 1
1.2研究意义 2
1.3本文结构 2
第2章 理论研究工具 4
2.1外部性理论分析 4
2.2效用函数 4
2.3斯塔克伯格博弈模型 5
第3章 联邦学习交易模型系统 7
3.1联邦学习交易模型系统概述 7
3.2联邦学习交易模型系统外部性描述及效用函数建模 8
3.2.1消费者外部性及其效用函数建模 8
3.2.2生产者外部性及其效用函数建模 9
3.2.3中间商外部性及其效用函数建模 10
3.3系统的斯塔克伯格博弈模型描述 10
3.4系统的斯塔克伯格博弈模型优化 11
3.4.1消费者建模优化 11
3.4.2生产者建模优化 11
3.4.3中间商建模优化 12
3.4.4系统效用函数最优结果 13
第4章 联邦学习交易模型系统的数值模拟 14
4.1系统模拟的应用工具 14
4.2系统模拟的参数配置 14
4.3系统模拟的图像结果及分析 15
4.3.1消费者数量对系统效用的影响 16
4.3.2生产者数量对系统效用的影响 19
4.3.3外部性因素对系统效用的影响 21
第5章 总结 24
参考文献 25
致谢 27
第1章 绪论
1.1研究背景与现状
随着信息时代的发展,我们的生活中出现了越来越多的移动设备和可穿戴设备,例如智能手机、智能手表、智能手环、平板电脑和人工智能助手等等[1]。由于这些智能产品可以极大程度地便捷生活,因此它们在日常生活中的使用时间占比很高。又因为这些设备的结构各不相同,所以它们会产生数量巨大且形态各异的数据,这些数据通常会用于帮助该设备的研发人员改善用户体验。但又因为各个设备的数据传输能力和计算速度参差不齐,再加上个人隐私安全问题的限制,这些数据往往不会上传而是存在本地设备上[1]。
而对于公司企业来说,他们每天运转所产生的数据数量更加庞大。如果将这样的数据洪流加以利用,那么人们的生活水平会变得更高。比如某公司选择与其他利益取向相近的公司进行合作来提升服务范围和服务水平,从而实现多方共赢。但是因为行业之间的激烈竞争,还有如何保证各公司客户的隐私安全问题,再加上有关隐私保护的法律的逐渐完善,公司想要将用户数据进行收集整合都不可能,更别说与其他公司在数据上进行合作了。
这些有着巨大商业价值和社会价值的数据洪流无法合理运用,只能被搁置起来,形成一个个数据孤岛[2][3]。为了能够充分挖掘这些数据的潜在价值,同时又能在符合法律规范、保障数据隐私安全的条件下解决数据孤岛问题,Google公司2016年提出了一种新的机器学习框架——联邦学习[4][5][6]。
联邦学习具有一些传统机器学习所没有的优点[1][7]:
- 带宽利用率高:由于聚集的数据信息更少,大大降低了通信成本并且减轻了主干网络的负担。
- 隐私性好:用户的原始数据不需要发送,直接在本地进行训练。这很好的保证了用户的隐私。
- 延迟低:在联邦学习中,机器学习模型可以持续训练和更新。而且边缘节点或者终端设备可以进行实施决策。
而正因为联邦学习这些独特的优点使得其可以在满足法律规范并且保护隐私的情况下,实现多方数据的合作共享。参与联邦学习的各方不需要将自己的数据传输给其余参与者,而是只需从云端下载统一的基本模型框架,然后在本地使用本地数据训练模型,最终上传至云端并由其整合模型即可。整个过程不会涉及到参与者的数据隐私安全问题,并且解决了数据孤岛问题[2]。
在了解了联邦学习模型在人工智能驱动的无线通信网络中的应用后,知道了联邦学习在金融领域(比如互联网企业和银行)、城市管理(计算机视觉领域)和生态建设(日常出行、通讯等)等方面都已经有了成功应用[8]。并且研究表明,联邦学习完全可以只在两方之间进行[8]。
但在日常生活中,两个公司或部门之间想要直接使用自己的数据进行合作是不太可能的,因为不同的公司或部门之间的系统组件、数据类型、网络模式都无法保证能够具有相近的结构。因此对于多方数据合作是必要且有实际价值的。但在对联邦学习的研究中,更多的是对联邦学习模型训练方面的研究,对于联邦学习在多方合作情况下的应用实例的研究很少。因此联邦学习在多方合作下的实际数值模拟应用研究还有所欠缺。所以本课题的主要研究方向就是对联邦学习在多方合作情况下进行数值模拟和分析。
1.2研究意义
本课题是假设在数据内容符合合作标准,但因为数据类型和存储方式等外部因素差异较大,需要多方合作的情况下进行研究的。研究的内容与实际市场中企业之间进行联邦学习合作的实际情况相符,而且可以将参与联邦学习的企业换作更小规模的群体或者个体,以市场化模型为基础,更加具有扩展性。研究的结果可以帮助各个参与者在一定条件下做出更好的决策,从而整体上获得更大的利润。
1.3本文结构
第1章是概述课题研究的背景和现状,说明联邦学习的优点和实际应用。并在联邦学习的现有研究的基础上指出本课题对于联邦学习研究的意义和价值。